Method Article
מטרת הפרוטוקול היא לפרט כיצד לאסוף נתוני וידאו לשימוש במעבדה; כיצד להקליט נתוני מעקב אחר עיניים של משתתפים התבוננות בנתונים וכיצד לנתח ביעילות את התוכן של קטעי וידאו שהם מחפשים באמצעות טכניקת לימוד מכונה.
כמו אנשים חיים יותר ויותר בערים, שיטות ללמוד את התנועות היומיומיות שלהם ואת הנתונים שניתן לאסוף הופך חשוב ויקר. אינפורמטיקה מעקב אחר העין ידועים להתחבר למגוון של רגשות, תנאי בריאות, מצבים נפשיים ופעולות. אבל מכיוון שחזון הוא תוצאה של תנועות עיניים מתמדת, להקניט מה חשוב ממה שרעש הוא מורכב ומידע אינטנסיבי. יתרה מזאת, אתגר משמעותי הוא שליטה על מה שאנשים מסתכלים לעומת מה שמוצג להם.
הבאים מציגים מתודולוגיה לשילוב וניתוח של מעקב אחר העיניים בווידאו של סצנה טבעית ומורכבת עם טכניקת למידה ממוחשבת לניתוח תוכן הווידאו. בפרוטוקול אנו מתמקדים בניתוח נתונים מסרטוני וידאו שצולמו, כיצד ניתן להשתמש בווידאו כדי להקליט את נתוני מעקב העיניים של המשתתפים, ולחשוב על האופן שבו ניתן לנתח את תוכן הווידאו ולשלבו עם נתוני המעקב אחר העין. אנו מציגים תקציר קצר של התוצאות ודיון בפוטנציאל השיטה למחקרים נוספים בסביבות מורכבות.
החוויות היומיומיות שלנו בסביבות עירוניות משפיעות מאוד על הבריאות והרווחה שלנו. הרווחה שלנו יכולה להיות תלויה בכמות החללים הירוקים שאנו רואים וחווים1,2,3, ותצוגות אלה ניתן לכמת באמצעות ציוד מעקב אחר העין כדי להנחות את קבלת החלטות בנוגע לעיצוב הפארק. עם זאת, מתעוררת בעיה עם הנפח של נתוני מעקב אחר העין הנוצרת ומקבלת תחושה של נתונים אלה. כאשר הציוד להקלטת הנתונים מבט במעבדה או הגדרה טבעית הופך להיות קל יותר לשימוש וחזק יותר, החוקרים צריכים לשקול כיצד נוכל לאסוף ולנתח נתונים ובאופן מוחלט כדי לעזור עם שאלות לקבלת ההחלטות.
עד כה, מחקר מחקרי עיניים רב השתמש בתצלומים בסקר או בקביעת מעבדה4. בעוד מתודולוגיה זו מאפשרת מידה רבה של שליטה והקפדה על תוצאות, זה לא יכול לנצל את ההתקדמות העדכנית ביותר בטכנולוגיה מעקב העין הכוללים את השימוש וידאו לבישים מעוקבים העין ניידים. יתר על כן, היינו טוענים כי הפעולה של הליכה ורוגע הוא בהכרח דינמי במיוחד כאשר מונחה לקראת משימה כגון למצוא5. לכן הבנה מדעית מלאה של הגדרות אלה צריכה להתרחש מחוץ למעבדה. עם זאת, כרגע, מעקב אחר העין במסגרת המציאות הטבעית הופך את השוואת החוויה בין הנושאים לקשה מאוד. לדוגמה, אם היינו רוצים להשוות בין אם המשיב האחד מסתכל על עצים יותר מאשר אחר, כיצד יכולנו לשלוט על העובדה שנקודת המבט שלהם תהיה משתנה ללא הרף לעומת אחרים או שהראש שלהם אולי התהפך. ניתוח מפורט בתנאים אלה הוא כמעט בלתי אפשרי עם טכניקות ניתוח נוכחיות. היינו טוענים כי חשוב לשלוט על אזורי הצפייה הזמינים לאדם ללמוד בניתוח כדי להיות מסוגל להסביר את הסצינה הכוללת הנצפים בכל נקודה אחת בזמן.
יש סדרה של תיאוריות לקשר רמות הלחץ ותפיסות של בטיחות לנוף נוף התפתח היטב אמצעים של לחץ6,7. הייתה גם עלייה מהירה בתחכום של ציוד מעקב עיניים כדי למדוד מבט8. מעקב אחר העין חשוב מכיוון שתנועות עיניים לא רצוניות יכול להיות מחובר יותר באופן אמין להעדפה, מתח ואמצעים אחרים מסורתיים מאשר סקרים פולשנית, בדיקות פיזיולוגיות כגון רמות קורטיזול הרוק. מטרת מחקר זה היא לפתח כלים המאפשרים מדידה מדויקת יותר של נתוני מעקב אחר העין החלים על הגדרות טבעיות יותר, כדי לספק ראיות נוספות עבור או להפריך תיאוריות הנוף ארוכת הטווח אשר הודיעו על עיצוב הפארק עבור עשורים.
מטרת הפרויקט היא לפתח ולבדוק טכניקת ניתוח הרומן שיכולה ליצור נתונים רלוונטיים למעקב אחר עיניים עבור קטעי וידאו שונים של הליכה בפארק סימולציות. העבודה שלנו דיווחה כאן ובמקומות אחרים9 מייצגת נקודה בחצי הדרך בין הסביבה הטבעית של מערכת מעקב העין הניידת לחלוטין ומחקרי צילום מבוססי מעבדה המכונה לעיל. בפרט, אנו מתרכזים בשימוש בקטעי וידאו כחומר הגירוי, חקר כיצד ניתן להשתמש בחומר זה כדי לבחון את כמות הקסם שפארקים שונים יוצרים בעיר מלבורן. העבודה שלנו מבוססת על ההנחה כי ניתוח מפורט של קטעי וידאו הוא צעד הכרחי להפר לפני התחייבות מלאה, הערכה טבעית יותר של הפוטנציאל של פארקים כדי לספק שחזור מהלחץ.
במחקר זה, אנו המועסקים שולחן העבודה עין-גשש עם קטעי וידאו של טיולים בפארקים עירוניים וביקשו מהמשתתפים לדמיין שהם לוקחים הליכה רגועה דרך הפארק. אנו מתארים שיטה כדי לאפשר את משך הזמן שהמשתתפים בילו להסתכל על חפצים שונים להיות דומים בין הפארקים. לימודי שולחן העבודה בדרך כלל קלים יותר לשליטה בהשוואה למחקרי ET ניידים ולאפשר ניתוח השוואתי של כל נושא.
התוכנה הסטנדרטית למעקב אחר עיניים משתמשת בתחום הידני של כלי הריבית שבו למפעיל יש אפשרות לצייר באופן ידני גבולות סביב אובייקטים מעניינים בכל סצינה. הדבר מאפשר את משך הזמן שבו המשתתפים השקיעו בחיפוש אחר אובייקטים שונים לספירה אוטומטית. עבור נתוני וידאו, תהליך זה הוא אינטנסיבי העבודה וכפוף המפעיל סובייקטיביות ושגיאה. בגירסאות מאוחרות יותר של תוכנת ניתוח מעקב אחר עיניים, ניתן לעקוב אחר אובייקטים באופן אוטומטי בין מסגרות כאשר הם בגודל זהה בווידאו. זה שיפור, עם זאת, זה נועד רק כדי לשמש מספר קטן של גירויים בכל תמונה וכל תמונה יש לבדוק ואישר.
תיוג ידני של אובייקטים בתמונה נפוץ ונתמך על ידי תוכנת עריכת תמונות כגון תוכנית מניפולציה תמונה של גנו (GIMP). בהינתן כי 1 s מייצרת 30 מסגרות או תמונות, את התיוג הידני של קטעי וידאו אינו מעשי. בנוסף, התוויות AOI על ידי ציור מצולעים וקטור סביב הקצה של אובייקטים מורכבים כגון חופות עץ הוא זמן רב מאוד. לבסוף, כל עוד אפשר לחשב את גודל האובייקטים בשדה תצוגה באמצעות תיוג וקטורי, תכונה זו אינה זמינה כעת.
השיטה שאנו מדווחים עליה מטפלת במגבלות אלה. מחקר זה העסיק תוויות אוטומטי של אובייקטים. אפשרות זו מאפשרת שימוש בטכניקת עיבוד תמונה המוכרת כתוויות סמנטי, שבה לכל פיקסל בכל אחת ממסגרות הווידאו מוקצה תווית המציינת מחלקת אובייקט. למידה ממוחשבת משמשת להפקת מסווג פיקסל עבור כל מחלקת האובייקט של העניין. המותגים האלה מספקים תווית בעלת יכולת מיטבית לכל פיקסל (הידוע כפוטנציאלים אונאריים), אשר מעודנים לאחר מכן בתהליך מיטוב שלאחר מכן כדי להשיג את הפלט הסופי המסומנת בתווית. מידע מסווג זה מלמד גבולות של החלטות סטטיסטיות בין כל מחלקות אובייקטים במרחב של תכונות המחולצות מהתמונה, כולל מרקם, היסטוגרמה של כיוון קצוות, ערכי צבע RGB וקואורדינטות של תמונה מנורמלת. טכניקה מתאימה לכך מיושמת בארגז הכלים של למידה ממוחשבת של דרווין10 והיא מתוארת להלן.
אישור מוסרי לפרויקט זה ניתן על ידי ועדת האתיקה של האוניברסיטה הקתולית האוסטרלית-אישור מספר201500036E. הדבר הבטיח כי הסכמה מושכלת הייתה מושגת מכל המשתתפים וכל המשתתפים השתתפו בהתנדבות ושהמשתתפים בנתונים נותרו אנונימיים וחסויים. בנוסף לכך ניתנה האישור בשל השיטה והציוד לפגישת התקנות בטיחות בתקנים אוסטרליים.
1. צילום סצנות עירוניות שניתן להשתמש בהן במחקר מעקב אחר עיניים
2. כיול ההתקנה ושולחן העבודה של ציוד מעקב עין
3. גיוס ואתיקה
4. התקנה ניסויית של משתתף
5. חיבור פארקים הנצפים כדי רשמים של קטעי וידאו
6. ניתוח וידאו אוטומטי לתחום הפקת הריבית
7. רישום נתוני מעקב העין לתוכן וידאו
8. הצגת פרק הזמן שהמשתתפים בחנו מחלקות שונות של אובייקטים בסרטונים
הערה: בשל הגודל העצום של נתוני מעקב אחר העין, השפה התכנות פיתון משמש טוב יותר עבור שלבים עד 8.4, למרות תוכנית עיבוד נתונים יכול לשמש גם.
איור 1 ו- איור 2 מראים את התוצאה של נטילת כל נתוני העין לאורך כל המשתתפים והפקת מפת חום; זוהי הגישה הסטנדרטית הזמינה בחבילות תוכנה למעקב אחר עיניים. על-ידי השוואת איור 1 ואיור 2 ניתן לזהות שבמשתתפים הממוצעים נסרק שמאלה וימינה על קואורדינטת x של הווידאו באיור 1 בהשוואה לאיור 2, המציגה צורה מלאה בסיבובים. זה בגלל שלאיור 1 היו אלמנטים אופקיים יותר לאורך הווידאו בהשוואה לפארק באיור 2. התמונה מאחורי מפת החום היא מסגרת אחת ואינה מייצגת את התוכן המלא של הווידאו.
מערכת המעקב אחר העיניים והתוכנה של שולחן העבודה סופרת רק תוצאות בהן ניתן למקם את שתי העיניים בו. במילים אחרות, אם לא ניתן לאתר מעין אחת או את שתי העיניים, הנתונים נספרים כאבודים. במקרה שלנו מעקב העין נתונים נתפס עבור > 80% מהזמן.
איור 3 ואיור 4 מראים את התוצאה של שימוש בפרוטוקול ושימוש בלמידה ממוחשבת כדי לנתח את תוכן הסרטונים. איור 3 מראה את הצמחייה הצפופה של הגנים פיצרוי לעומת הצמחייה הדלילה יחסית של רויאל פארק (איור 4). במקרה האחרון, יותר שמים גלויים, יותר מבין הסצינות נשלטים על ידי צמחייה שיחים. איור 5 מציג את זמן הקיבוע% על האובייקטים השונים במהלך הווידאו עבור אחד המשתתפים. זה מראה כי למרות שהנתיב נראה בבירור במהלך הווידאו, המשתתף רק מסתכל על תכונה זו מדי פעם, אבל בנקודות מפתח. באופן דומה, כמו איור 6 מראה, למרות חלק קטנטן של התוכן של הווידאו ברויאל פארק מתייחס אובייקטים מלאכותיים, המשתתף במחקר בוחן את התכונות הללו במידה רבה יחסית.
הממצאים באיור3, איור 4, איור 5, ואיור 6 ניתן לסכם באיור 7 ואיור 8 עבור כל 39 המשתתפים אשר הנתונים שימשו במחקר זה. איור 7 מציג את הזמן להתעכב עבור כל המשתתפים כאשר מסתכלים על אובייקטים לאורך הווידאו. איור 8 מראה את אותם נתונים מחולקים על ידי כמות הזמן והמרחב כי אובייקטים שונים אלה שנכבשו בווידאו. ערך של 1 מציין שניתן להתייחס לזמן ההתעכב על-ידי כמות האובייקט בווידאו. איור 7 מראה שחפצים מלאכותיים כגון מנורות רחוב וספסלים מושכן במידה רבה יותר בהשוואה לחפצים אחרים (> 1). איור 7 גם מראה כי אובייקטים שהיו פחות רלוונטיים, כגון השמים בשתי התמונות, נצפו יחסית פחות (< 1).
איור 1: מפת חום לדוגמה המופקת עבור הווידאו כולו של אחד הפארקים. זה מראה איפה הרוב של פסי העין היו ממוקמים. שים לב לצורה האופקית של מפת החום בשל הדומיננטיות של רכיבים אופקיים בווידאו. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 2: מפת החום לדוגמה המופקת עבור הווידאו כולו של אחד הפארקים האחרים. שים לב לצורה המעוגל יותר בשל נוכחותם של רכיבים אנכיים ואופקיים בווידאו. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 3: היסטוגרמה של תוכן בוידאו של פיטזרוי גרדנס שנותחו באמצעות טכניקת הלמידה של המכונה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 4: היסטוגרמה של תוכן וידאו של רויאל פארק ניתח באמצעות טכניקת למידה מכונה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 5: מעקב העין זמן קיבעון בילה מסתכל על חפצים בגני פיטזרוי. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 6: הזמן קיבעון מעקב העין בילה להסתכל על חפצים ברויאל פארק. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 7: מעקב מצטבר של העיניים פעמים עבור כל המשתתפים והאובייקטים עבור שני הפארקים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
איור 8: מעקב מצטבר של שעות העיניים ביחס לתוכן עבור כל המשתתפים והאובייקטים עבור שני הפארקים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.
באופן כללי, בחבילות תוכנה סטנדרטיות לניתוח נתוני מעקב אחר עיניים, נעשה שימוש בווקטור AOI. אפילו עבור תמונה בודדת, לא ניתן למדוד בקלות את גודל הווקטור. יתרה מזאת, כולל כל האואוס בתמונה וחישוב הכמויות היחסיות של האואוס הוא מפרך. כמעט בלתי אפשרי לעשות זאת באופן ידני על וידאו ללא טכניקת למידה מכונה כמו זו שתוארה. זו הייתה הצהרה פשוטה יחסית. שיכולה להיות מקרה של צפייה בחינם תרחיש מדויק הרבה יותר יכול לשמש תיאורים תרחיש שונה לפני גירוי זהה יכול גם להשפיע על תנועות העין11.
המחקר שלנו השתמש בשיטה לסיווג במדויק אובייקטים בווידאו וניתוח המידה שבה אלה היו גלויים לעין. השיטה מייצגת אמצעי חשבונאות אחד במידה שבה תנועות העין מקושרות לאובייקטי עניין. פעולה זו מאפשרת את המידה שבה אובייקטים של עניין נמצאים בשדה תצוגה שניתן לשלוט בהם בעת השוואת מעקב אחר העין מנושאים שונים באמצעות מכשיר למעקב אחר עיניים, או מיקומים שונים בעת שימוש במערכת מבוססת שולחן עבודה. שיקולים שיכולים להשפיע על הסיווג האוטומטי של אובייקטים באמצעות לימוד המכונה שאנו מעסיקים כוללים תאורה, צורות ביחס למה שהוא מסווג (למשל לא רק סוג אחד של עץ אלא מגוון של סוגי עצים, המיקום שלהם ב תמונה, האופן שבו הם מוארים וכו '.), מרקם וצבע. שיקולים לגבי מספר המסגרות כוללים את האורך והווריאציה של התנאים החזותיים הוצגו על פני הווידאו שנותחו, כמו גם את מספר מחלקות האובייקטים שיש לזהות ואת תדירות הופעתם. המסגרות משתנות כל 1/25 שניות, אך מעקב אחר העין עם התוכנה מתרחשת ב-1/120 (120 Hz). מסיבה זו, נתוני מעקב אחר העין ייאספו ב-4.8 פעמים בקצב שבו מופיע מסגרת חדשה. לא ניתן לתייג את התווית באופן מדויק לחלוטין, אך התוויות של המסגרות אמורות להשתנות כל 5 פעמים. לדוגמה, נתוני מעקב אחר עיניים במהלך 99 עד 101 s כבר נחשב עבור המסגרת של השניה ה-100 של הווידאו.
יתרון משמעותי של חבילות הנוכחי מעקב העין הוא שהם מוגדרים כדי לאפשר למשתמשים לסקור את הסרט של שלהם מעקב העין שלהם מסלולים ולתאר למה הם הסתכלו על אובייקטים מסוימים. התוצאה היא ערכת נתונים איכותית שיכולה לגלות מדוע נושאים בודדים חושבים שהם הסתכלו על אובייקטים מסוימים. הארכה של הפרויקט תהיה גם להראות להם את כמות הזמן שהם בילו הסתכלות על אובייקטים בזמנים שונים ביחס לתוכן, למשל המידע באיור 8. עם זאת, ביצוע פעולה זו על-ידי שליטה במספר האובייקטים בסצינה במהירות מספקת כעת אינו אפשרי.
לדוגמה, ניתן לבקש מהמשתתפים לצפות בנתיבי המבט שלהם שנרשמו ולתאר מדוע הם הסתכלו על האובייקטים המיוחדים12. במקרה שלנו, בסוף כל המשתתפים הסרט נשאלו לדרג את כל הפארקים בקנה מידה של 1-10, ראשית אם הם חשו שהם יוכלו לנוח ולהתאושש בסביבה הזאת (1, לא הרבה, עד 10, מאוד) ושנית כמה הם אוהבים את פארק (1, לא הרבה, עד 10, הרבה).
לא
עבודה זו היה נתמך כספית על ידי עיריית מלבורן וחלקית על ידי ARC DP 150103135. ברצוני להודות לאיאמאון Fennessy על העצה והגישה השיתופית שלו. בזכות מיוחדת לחוקר המסייע איזבל ג'צקי ואיתן חן, שסייעו גם הם לאסוף ולנתח נתונים אלה. כל השגיאות נשארות המחברים.
Name | Company | Catalog Number | Comments |
12 mm lens | Olympus | Lens | |
Panasonic GH4 | Panasonic | Video Camera | |
Tobii Studio version (2.1.14) | Tobii | Software | |
Tobii x120 desktop eye-tracker | Tobii | Eye-tracker |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved