Method Article
والهدف من البروتوكول هو تفصيل كيفيه جمع بيانات الفيديو لاستخدامها في المختبر ؛ كيفيه تسجيل بيانات تتبع العين للمشاركين الذين يبحثون في البيانات وكيفيه تحليل محتوي مقاطع الفيديو التي كانوا يبحثون فيها باستخدام تقنيه تعلم آلات بكفاءة.
وبما ان الافراد يعيشون بشكل متزايد في المدن ، فان أساليب دراسة تحركاتهم اليومية والبيانات التي يمكن جمعها تصبح مهمة وقيمه. ومن المعروف ان المعلوماتية تتبع العين للتواصل مع مجموعه من المشاعر, الظروف الصحية, الحالات العقلية والإجراءات. ولكن لان الرؤية هي نتيجة لحركات العين المستمرة ، وأغاظه ما هو مهم من ما هو الضجيج معقده والبيانات المكثفة. وعلاوة علي ذلك ، هناك تحد كبير يتمثل في السيطرة علي ما ينظر اليه الناس مقارنه بما يقدم لهم.
وفيما يلي منهجيه للجمع بين وتحليل تتبع العين علي شريط فيديو للمشهد الطبيعي والمعقد مع تقنيه التعلم الألى لتحليل محتوي الفيديو. في البروتوكول نركز علي تحليل البيانات من أشرطه الفيديو المصورة ، وكيف يمكن استخدام الفيديو علي أفضل وجه لتسجيل بيانات تتبع العين للمشاركين ، والاهم كيف يمكن تحليل محتوي الفيديو ودمجه مع بيانات تتبع العين. ونقدم ملخصا موجزا للنتائج ومناقشه لإمكانيات الطريقة لاجراء مزيد من الدراسات في البيئات المعقدة.
ان تجاربنا اليومية التي نعيشها في البيئات الحضرية تؤثر بشكل كبير علي صحتنا ورفاهيتنا. ويمكن لرفاهيتنا ان تعتمد علي كميه المساحات الخضراء التي نري ونختبرها1،2،3، ويمكن قياس هذه الآراء باستخدام معدات تتبع العين لتوجيه صنع القرار حول تصميم المتنزه. ومع ذلك ، تنشا مشكله مع حجم بيانات تتبع العين التي يتم إنشاؤها والشعور بهذه البيانات. وبما ان المعدات اللازمة لتسجيل بيانات البصر في المختبر أو الاعداد الطبيعي تصبح أسهل في الاستخدام وأكثر قوه ، يحتاج الباحثون إلى النظر في كيفيه جمع وتحليل البيانات بشكل صحيح للمساعدة في الاسئله المتعلقة بصنع القرار.
حتى الآن ، وقد استخدمت قدرا كبيرا من البحوث تتبع العين الصور في مسح أو مختبر الاعداد4. في حين ان هذه المنهجية تسمح لقدر كبير من الاستنساخ والسيطرة علي النتائج ، فانها غير قادره علي الاستفادة من أحدث التطورات في تكنولوجيا تتبع العين التي تشمل استخدام الفيديو ويمكن ارتداؤها المحمولة بتتبع العين. وعلاوة علي ذلك ، فاننا نقول ان العمل من المشي والاسترخاء هو بالضرورة ديناميكية وخاصه عندما توجه نحو مهمة مثل الطريق5. ولذلك فان الفهم العلمي الكامل لهذه الإعدادات ينبغي ان يتم خارج المختبر. ومع ذلك ، في الوقت الراهن ، فان تتبع العين في بيئة طبيعيه واقعيه يجعل مقارنه التجربة بين المواضيع صعبه للغاية. علي سبيل المثال ، إذا أردنا مقارنه ما إذا كان أحد المجيبين ينظر إلى الأشجار أكثر من الآخر ، كيف يمكننا التحكم في حقيقة ان وجهه نظرهم ستتغير باستمرار بالمقارنة مع الآخرين أو ان رؤوسهم قد انقلبت. تحليل مفصل في هذه الظروف يكاد يكون من المستحيل مع تقنيات التحليل الحالية. ونحن نقول انه من المهم السيطرة علي مناطق المشاهدة المتاحة للفرد الذي يجري دراسته وفي التحليل ليكون قادرا علي حساب المشهد الإجمالي الذي ينظر اليه في اي نقطه زمنيه واحده.
هناك مجموعه من النظريات التي تربط بين مستويات التوتر والتصورات للسلامة لمناظر طبيعيه ومقاييس متطورة من الإجهاد6,7. وكانت هناك أيضا زيادة سريعة في تطور معدات تتبع العين لقياس البصر8. تتبع العين أمر مهم لان حركات العين غير الطوعية قد تكون مرتبطة بشكل أكثر موثوقيه بالتفضيل والإجهاد وغيرها من الإجراءات التقليدية من المسوحات والاختبارات الفسيولوجية التدخلية مثل مستويات الكورتيزول اللعابية. والهدف من هذا البحث هو تطوير الاداات التي تمكن من قياس أدق لبيانات تتبع العين المطبقة علي المزيد من الإعدادات الطبيعية ، وذلك لتقديم المزيد من الادله علي أو دحض نظريات المناظر الطبيعية القديمة التي قامت بتصميم المتنزه عقود.
الهدف من هذا المشروع هو تطوير واختبار تقنيه تحليل جديده يمكن ان تولد البيانات المناسبة لتعقب العين لأشرطه الفيديو المختلفة من محاكاة المشي بارك. ويمثل عملنا الذي تم الإبلاغ عنه هنا وفي أماكن أخرى9 نقطه في منتصف الطريق بين الوضع الطبيعي لنظام تتبع العين المتنقل بالبالكامل ودراسات الصور المستندة إلى المختبر المشار اليها أعلاه. علي وجه الخصوص ، ونحن نركز علي استخدام أشرطه الفيديو والمواد التحفيزية ، واستكشاف كيف يمكن استخدام هذه المواد لاختبار كميه من السحر ان الحدائق المختلفة التي تولد في مدينه ملبورن. ويستند عملنا علي افتراض ان التحليل المفصل لأشرطه الفيديو هو خطوه ضرورية للإخلال قبل القيام بتقييم اوفي وأكثر طبيعيه لإمكانات الحدائق لتوفير استعاده من الإجهاد.
في هذه الدراسة ، استخدمنا جهاز كمبيوتر سطح المكتب تعقب العين مع أشرطه الفيديو من المشي من خلال الحدائق الحضرية وطلبت من المشاركين ان يتصوروا انهم كانوا ياخذون نزهه الاسترخاء من خلال حديقة. نقوم بوصف طريقه للسماح بمقدار الوقت الذي أنفقه المشاركون في البحث عن كائنات مختلفه لتكون قابله للمقارنة بين الحدائق. الدراسات المكتبية هي أسهل عموما للسيطرة مقارنه مع الدراسات المتنقلة ET والسماح التحليل المقارن لكل موضوع.
تستخدم برمجيات تتبع العين القياسية أداه مجال الاهتمام اليدوية التي يمكن للمشغل فيها رسم الحدود يدويا حول الأشياء ذات الاهميه في كل مشهد. يتيح ذلك مقدار الوقت الذي يقضيه المشاركون في البحث عن كائنات مختلفه ليتم حسابها تلقائيا. النسبة لبيانات الفيديو ، فان هذه العملية كثيفه العمالة وتخضع لذاتية المشغل والخطا. في الإصدارات اللاحقة من برنامج تحليل تتبع العين ، يمكن ل AOIs تعقب الكائنات تلقائيا عبر الإطارات عندما تكون بنفس الحجم في الفيديو. هذا هو التحسن ، ومع ذلك ، وهذا هو المقصود فقط لاستخدامها لعدد قليل من المحفزات في كل صوره ويجب ان يتم فحص كل صوره وتاكيدها.
الوسم اليدوي للكائنات في صوره أمر شائع ويدعمه برنامج تحرير الصور مثل برنامج التلاعب بالصور غنو (الأعرج). النظر إلى ان 1 s تنتج 30 إطارات أو الصور ، والوسم اليدوي لأشرطه الفيديو غير عملي. الاضافه إلى ذلك ، فان وضع العلامات بواسطة المضلعات المتجهة حول حافه الأجسام المعقدة مثل الستائر الشجرية يستغرق وقتا طويلا. وأخيرا ، في حين انه من المتصور انه من الممكن حساب حجم الأجسام في مجال الرؤية باستخدام وسم النواقل ، فان هذه الميزة غير متاحه حاليا.
الطريقة التي نقوم بالإبلاغ عنها أدناه تتعامل مع هذه القيود. استخدمت هذه الدراسة الوسم التلقائي للكائنات. وهذا ممكن باستخدام تقنيه معالجه الصور المعروفة باسم العلامات الدلالية ، حيث يتم تعيين كل بيكسل في كل اطار من الفيديو علي تسميه تشير إلى فئة كائن. يتم استخدام التعلم الألى لاشتقاق مصنفات بكسل لكل فئة كائن من الاهتمام. توفر هذه المصنفات تسميه احتماليه لكل بيكسل (المعروفة بالإمكانات الاحاديه) ، والتي يتم صقلها بعد ذلك في عمليه تحسين لاحقه لتحقيق الناتج النهائي المسمي. هذه مصنفات تعلم حدود القرارات الاحصائيه بين كل فئة من فئات الكائنات في مساحة المعالم المستخرجة من الصورة ، بما في ذلك الملمس ، والرسم البياني لاتجاات الحواف ، وقيم ألوان RGB ، وإحداثيات الصورة التي تم تطبيعها. ويتم تنفيذ تقنيه مناسبه لهذا الأمر في مربع أدوات التعلم اله داروين10 ويرد أدناه.
وقدمت الموافقة الاخلاقيه لهذا المشروع من قبل لجنه الأخلاق في الجامعة الكاثوليكية الاستراليه-رقم الموافقة #201500036E. وكفل ذلك الحصول علي موافقه مستنيرة من جميع المشاركين وشارك جميع المشاركين طوعا ، وظلت بيانات المشاركين مجهوله وسريه. [أين ديايشن] أعطيت الموافقة كان واجبه الأسلوب وتجهيز اجتماع استراليه معايير أمان نظام تعديل.
1. تصوير المشاهد الحضرية التي يمكن استخدامها في دراسة تتبع العين
2. الاعداد والمعايرة المكتبية لمعدات تتبع العين
3-التوظيف والأخلاق
4. الاعداد التجريبي للمشاركين
5. ربط الحدائق المشاهدة إلى انطباعات من أشرطه الفيديو
6. تحليل الفيديو التلقائي لمنطقه الفائدة استخراج
7. تسجيل بيانات تتبع العين في محتوي الفيديو
8. عرض مقدار الوقت الذي درس فيه المشاركون فئات مختلفه من الكائنات في مقاطع الفيديو
ملاحظه: نظرا للحجم الضخم لبيانات تتبع العين ، يتم استخدام لغة برمجه بيثون بشكل أفضل للخطوات من خلال إلى 8.4 ، علي الرغم من انه يمكن استخدام برنامج معالجه البيانات أيضا.
ويبين الشكل 1 والشكل 2 نتيجة أخذ جميع بيانات تتبع العين للفيديو بأكمله في جميع المشاركين وإنتاج خريطة للحرارة ؛ هذا هو النهج القياسية المتاحة في حزم برامج تتبع العين. من خلال مقارنه الشكل 1 والشكل 2 ، من الممكن تحديد ان المشاركين في المتوسط قاموا بفحص اليسار واليمين علي احداثي x للفيديو في الشكل 1 بالمقارنة مع الشكل 2، والذي يظهر شكل مستدير. وهذا لان الشكل 1 كان العناصر الافقيه أكثر في جميع انحاء الفيديو مقارنه مع الحديقة في الشكل 2. الصورة وراء خريطة الحرارة هي اطار واحد ولا تمثل بشكل كاف المحتوي الكامل للفيديو.
نظام تتبع العين سطح المكتب والبرمجيات التهم فقط النتائج حيث يمكن ان تكون موجودة كلا العينين في نفس الوقت. وبعبارة أخرى ، إذا كانت واحده أو كلتا العينين لا يمكن تحديد موقع يتم حساب البيانات كما فقدت. في حالتنا تم التقاط بيانات تتبع العين ل> 80% من الوقت.
ويبين الشكل 3 والشكل 4 نتيجة استخدام البروتوكول واستخدام التعلم الألى لتحليل محتوي مقاطع الفيديو. ويبين الشكل 3 الغطاء النباتي الكثيف لحدائق فيتزوري مقارنه بالغطاء النباتي المتناثر نسبيا في رويال بارك (الشكل 4). في هذا الأخير ، والمزيد من السماء مرئية ، ويهيمن علي المزيد من المشاهد من النباتات شجيرة. يوضح الشكل 5 النسبة المئوية لوقت التثبيت علي الكائنات المختلفة اثناء سير الفيديو لأحد المشاركين. ويظهر انه علي الرغم من ان المسار مرئي بوضوح اثناء سير الفيديو ، الا ان المشارك ينظر إلى هذه الميزة في بعض الأحيان ولكن في النقاط الرئيسية. المثل ، وكما يبين الشكل 6 ، علي الرغم من ان جزءا صغيرا من محتوي الفيديو في رويال بارك يتعلق بالأجسام الاصطناعية ، فان المشارك في الدراسة يفحص هذه الخصائص إلى حد كبير نسبيا.
ويمكن تلخيص النتائج التي توصل اليها الشكل3والشكل 4والشكل 5والشكل 6 في الشكل 7 والشكل 8 لجميع المشاركين ال39 الذين استخدمت بياناتهم في هذه الدراسة. يبين الشكل 7 وقت السكون لجميع المشاركين عند النظر إلى الأشياء طوال مده الفيديو. ويبين الشكل 8 هذه البيانات نفسها مقسومه علي مقدار الوقت والمساحة التي احتلتها هذه الكائنات المختلفة في الفيديو. تشير القيمة 1 إلى انه يمكن حساب وقت السكون بمقدار الكائن في الفيديو. ويبين الشكل 7 ان الأجسام الاصطناعية مثل مصابيح الشوارع والمقاعد يتم السكن فيها إلى حد كبير مقارنه بالأجسام الأخرى (> 1). ويبين الشكل 7 أيضا ان الأجسام التي كانت اقل صله بالموضوع ، مثل السماء في كلا الصورتين ، كانت تعتبر اقل نسبيا (< 1).
الشكل 1: خريطة الحرارة علي سبيل المثال التي يتم إنتاجها للفيديو الكامل لأحد المتنزات. وهذا يبين المكان الذي تقع فيه غالبيه مسارات العين. لاحظ الشكل الأفقي لخريطة الحرارة بسبب هيمنة العناصر الافقيه في الفيديو. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 2: خريطة الحرارة المثال التي يتم إنتاجها للفيديو بأكمله من واحد آخر من الحدائق. لاحظ الشكل الأكثر استدارة بسبب وجود عناصر عموديه وافقيه في الفيديو. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 3: تحليل الرسم البياني للمحتوي في فيديو حدائق فيتزوري باستخدام تقنيه التعلم الألى. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 4: تحليل الرسم البياني للمحتوي في شريط فيديو رويال بارك باستخدام تقنيه التعلم الألى. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 5: وقت تثبيت تتبع العين الذي يقضيه البحث في الكائنات في حدائق فيتزوري. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 6: وقت تثبيت تتبع العين الذي يقضيه البحث في الكائنات في Royal Park. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 7: أوقات التجمع المجمعة لتتبع العين لجميع المشاركين والكائنات لكلا المنتزين. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
الشكل 8: التجميع المجمع لتتبع العين مرات بالنسبة للمحتوي لجميع المشاركين والكائنات لكلا المتنزهين. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.
بشكل عام ، في حزم البرمجيات القياسية لتحليل بيانات تتبع العين ، يتم استخدام ناقل الحركة المتوسطة. حتى بالنسبة للصورة الثابتة المفردة ، لا يمكن قياس حجم المتجه بسهوله. وعلاوة علي ذلك ، بما في ذلك جميع AOIs في صوره وحساب الكميات النسبية من AOIs شاقه. يكاد يكون من المستحيل القيام بذلك يدويا علي الفيديو دون تقنيه التعلم اله مثل واحده وصفها. وكان هذا عبارة بسيطه نسبيا التي يستنتج حاله مشاهده مجانية. ويمكن استخدام سيناريو أكثر دقه بكثير وأوصاف السيناريو المختلفة قبل نفس الحافز يمكن ان تؤثر أيضا حركات العين11.
استخدمت أبحاثنا طريقه لتصنيف الكائنات بدقه في الفيديو وتحليل مدي وضوحها للعين. وتمثل الطريقة وسيله واحده للمحاسبة عن مدي ارتباط حركات العين بالأشياء ذات الاهميه. وهذا يمكن من مدي وجود الأشياء ذات الاهميه في مجال الرؤية ليتم التحكم فيها عند مقارنه تتبع العين من مواضيع مختلفه بجهاز محمول لتعقب العين ، أو مواقع مختلفه عند استخدام النظام القائم علي سطح المكتب. الاعتبارات التي يمكن ان تؤثر علي التصنيف التلقائي للكائنات باستخدام اله تعلم نستخدمها وتشمل الاضاءه ، والاشكال فيما يتعلق بما يجري تصنيفه (عليسبيل المثال ليس فقط نوع واحد من شجره ولكن مجموعه من أنواع الأشجار ، وموقفهم في الصورة ، والطريقة التي أضاءت الخ) ، والملمس ، واللون. وتشمل الاعتبارات المتعلقة بعدد الإطارات طول واختلاف الظروف البصرية المعروضة عبر الفيديو الذي يجري تحليله ، فضلا عن عدد فئات الكائنات التي يجب تحديدها وتواتر ظهورها. تتغير الإطارات كل 1/25 ثانيه ، ولكن تتبع العين مع البرنامج يحدث عند 1/120 (120 هرتز). لهذا السبب سيتم جمع بيانات تتبع العين في 4.8 مرات معدل ظهور اطار جديد. وليس من الممكن تسميه الإطارات بدقه تامه ولكن ينبغي تغيير وسمها كل 5 مرات. علي سبيل المثال ، تم النظر في بيانات تتبع العين خلال 99 إلى 101 s للإطار من الثانية 100th من الفيديو.
ومن المزايا الهامه لحزم تتبع العين الحالية انها تم اعدادها للسماح للمستخدمين بمراجعه فيلم من التثبيتات والمسارات الخاصة بهم لتتبع العين ووصف لماذا نظروا في أشياء معينه. وينتج عن ذلك مجموعه بيانات نوعيه يمكن ان تكشف لماذا تعتقد المواضيع الفردية انها نظرت إلى أشياء معينه. ومن شان تمديد المشروع ان يبين لهم أيضا مقدار الوقت الذي يقضونه في النظر إلى الأشياء في أوقات مختلفه بالنسبة للمحتوي ، علي سبيل المثال المعلومات المنصوص عليها في الشكل 8. ومع ذلك ، فان القيام بذلك عن طريق التحكم في عدد الكائنات في المشهد بسرعة كافيه غير ممكن حاليا.
فعلي سبيل المثال ، يمكن ان يطلب من المشاركين ان ينظروا إلى مسارات البصر الخاصة بهم التي سجلت وان يصفوا لماذا نظروا في الأجسام المحددة12. في حالتنا ، في نهاية كل فيلم وطلب من المشاركين لتقييم كل من الحدائق علي مقياس 1-10 ، أولا لما إذا كانوا يشعرون انهم سيكونون قادرين علي الراحة والتعافي في تلك البيئة (1 ، ليس كثيرا ، إلى 10 ، كثيرا جدا) وثانيا كم كانوا يحبون بارك (1 ، ليس كثيرا ، إلى 10 ، كثيرا).
اي
وكان هذا العمل مدعوما ماليا من قبل مدينه ملبورن وجزئيا من قبل ARC موانئ دبي 150103135. ونود ان نشكر ايامونن فنيسي علي مشورته ونهجه التعاوني. وبفضل خاص لمساعدي الباحث ايزابيل جانيكي وإيثان تشن الذين ساعدوا أيضا في جمع وتحليل هذه البيانات. تبقي كافة الأخطاء المؤلفين.
Name | Company | Catalog Number | Comments |
12 mm lens | Olympus | Lens | |
Panasonic GH4 | Panasonic | Video Camera | |
Tobii Studio version (2.1.14) | Tobii | Software | |
Tobii x120 desktop eye-tracker | Tobii | Eye-tracker |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved