Method Article
Un análisis de costo-beneficio es un enfoque de balanza que el cerebro lleva a cabo durante el curso de la toma de decisiones. Aquí, proponemos un protocolo para entrenar a las ratas en un paradigma de toma de decisiones basado en la operante en ratas elegir recompensas más altas a costa de esperar 15 s para recibirlos.
Guiada por el refuerzo de la toma de decisiones es la capacidad de elegir entre cursos de competencia de acción basada en el valor relativo de los beneficios y sus consecuencias. Este proceso es parte integral de la conducta humana normal y se ha demostrado para ser interrumpidas por trastornos neurológicos y psiquiátricos tales como depresión, esquizofrenia y adicción. Roedores han sido utilizados para descubrir la neurobiología de la cognición humana. Para ello, se han desarrollado varias tareas conductuales; sin embargo, la mayoría es no automatizados y mano de obra intensiva. El reciente desarrollo del microcontrolador open source ha permitido a los investigadores automatizar las tareas basado en la operante para evaluar una variedad de tareas cognitivas, estandarizar la presentación de estímulos, mejorar la grabación de datos y por lo tanto, mejorar los resultados de la investigación. Aquí, describimos automatizada basado en la demora guiada por el refuerzo de toma de decisiones tarea, usando un operante T-laberinto controlada por programas de software de medida. Mediante estas tareas de toma de decisiones, mostramos los cambios en las actividades potenciales de campo local en la corteza cingulada anterior de una rata mientras realiza una tarea de toma de decisiones y costo-beneficio basado en la demora.
Toma de decisiones es el proceso de reconocer y seleccionar decisiones basadas en los valores y preferencias de las decisiones y las consecuencias de la acción seleccionada1. Aunque la toma de decisiones ha sido extensamente estudiada en diferentes campos (es decir, economía, psicología y neurociencia), mecanismos neuronales subyacentes a tales capacidades cognitivas no se entienden todavía completamente. Dos subcategorías de toma de decisiones son decisiones perceptuales y guiada por el refuerzo de la toma de decisiones. Aunque incorporan conceptos y elementos de superposición considerable, perceptivo de la toma de decisiones se basa en la información sensorial disponible1,2, considerando que la toma de decisiones guiada por refuerzo aborda el valor relativo de acciones durante un plazo específico3. Un aspecto importante del armado de la toma de decisiones es el análisis de costo-beneficio que se realiza de forma intuitiva por el cerebro calculando los beneficios de las opciones dadas y restando los costes de cada alternativa1.
El T-laberinto (o la variante laberinto) es uno de los laberintos más utilizado en experimentos cognitivos con roedores. Animales se colocan en el brazo de arranque (la base de la T) y permite elegir el brazo de objetivo (uno de los brazos laterales). Tareas como una alternancia forzada o discriminación izquierda y derecha se utilizan principalmente con los roedores en la T-laberinto a la prueba de referencia y trabajo memoria4. T-laberintos son también ampliamente utilizados en experimentos de toma de decisiones5,6,7. En el diseño más simple, la recompensa se coloca en el brazo de un único objetivo. La elección es predecible, y animales sin duda prefiere la recompensa más que nada, independientemente del valor de la recompensa. Otra opción es colocar recompensas en ambos brazos del objetivo y dejar que los animales tomar una decisión de qué camino tomar dependiendo de varios parámetros (es decir, la preferencia natural de los animales, la diferencia en el valor de las recompensas y los costos a pagar). En el diseño basado en el valor, la tarea se complica más por tener propiedades de escala de pesaje. De esta manera, un animal recibe recompensas diferentemente valorados por elegir entre dos alternativas, así como los costos de las acciones [es decir, la cantidad de espera (delay-basado) o la cantidad de esfuerzo (esfuerzo-basado) necesario para recibir recompensas], cada uno contribuye a la decisión que se hace de5,6.
Tradicional basada en el retraso T-laberinto toma de decisiones, los animales están capacitados para seleccionar el brazo de la recompensa alta (HRA) y evitar lo contrario brazo baja recompensa (del Señor LRA). Los lados de la HRA y el LRA permanecen sin cambios durante todo el experimento. Aunque la tarea descrita anteriormente ha sido bien documentada en la literatura, sufre de varios inconvenientes procesales. En primer lugar, por tener un brazo de objetivo fijo, el animal sabe que el brazo para elegir desde el comienzo de cada ensayo. En este escenario, los animales pueden seleccionar el brazo objetivo basado en su memoria y no en la toma de decisiones. Por lo tanto, en un paradigma de toma de decisiones basado en la demora, si un animal selecciona la recompensa baja debido a la intervención del estudio, no será claro si esto es debido a una pérdida de memoria o a la intervención del estudio. Puede ser considerada como un grupo de control de memoria para segregar el comportamiento observado por el problema de memoria, pero esto afecta investigadores y animales por igual debido a los trabajos adicionales7. Una segunda preocupación es el momento de la toma de decisiones por el animal: una vez los animales a la zona de decisión (la Unión de los tres brazos), suelen mirar a la izquierda y a la derecha, pesan los costos y beneficios con respecto a cada brazo y entonces tomar su decisión. Sin embargo, después de unos pocos ensayos, realizan tal cómputo antes de llegar a la zona de decisión y ejecuta directamente en el brazo de recompensa. Como resultado, estos dos inconvenientes — un sesgo previo a uno de los brazos y encontrar el momento de la toma de decisiones, ambos altamente interrumpen la interpretación del electrofisiológicos y los datos de neuroimagen.
En el método explicado en este artículo, el brazo preferido (HRA) se localiza por una señal auditiva y puede variar de ensayo a ensayo. Animales inician los ensayos al entrar en la zona de prueba (figura 1) y dispara la señal auditiva pinchándola"nariz-" una puerta infrarrojos que se ha colocado en el cruce de los tres brazos. La señal de audio (20 dB, entre 500 y 1.000 ms) se juega desde un altavoz en el extremo del brazo de meta.
Todos los procedimientos explicaron aquí fueron aprobados y realizados conforme a la guía para el cuidado y uso de animales de laboratorio y fueron aprobados por el Comité de ética Animal Florey Institute o el centro de investigación de Neurociencia.
1. vivienda, manejo y restricción de alimentos
2. Montaje experimental
3. habituación al laberinto
4. discriminación formación
5. retardo de formación
6. electrofisiología (fabricación de electrodos)
7. anestesia
8. quirúrgico
9. después del procedimiento formación
Los datos presentados aquí están la LFP grabada desde la corteza orbitofrontal izquierda (OFC) y la corteza cingulada anterior (ACC) de seis ratas Wistar macho con electrodos bipolares (de acero inoxidable recubierto de PFA). La tabla 1 muestra la longitud de la adquisición de comportamiento para cada etapa de formación. Las coordenadas de los lugares de destino se determinaron a partir de una rata cerebro atlas9 y son las siguientes: para la AAC, 1,2 mm anterior bregma, 0,8 mm lateral a la línea media y ventral al cráneo; 2 mm y para el OFC, 3,5 mm anterior el bregma, 2,3 mm lateral a la línea media y ventral al cráneo 5,4 mm.
Las grabaciones fueron filtrado pasabanda (0.01 - 250 Hz) para extraer LFPs y luego muestrearon a 1000 Hz. El análisis espectral fue realizado en LFPs utilizando la forma cónica múltiple10. Cinco cirios de Slepian y un producto de ancho de banda de tiempo de tres se utilizaron para lograr la óptima concentración espectral. Tiempo frecuencia espectrogramas se estimaron utilizando una-ventana corredera de 300 ms que fue cambiado de puesto sobre los datos en pasos de 5 ms. Para una mejor observación de la modulación de la tarea dependiente de las potencias espectrales y para atenuar el problema de energía de escala 1/f, espectrogramas todos fueron base normalizada y se convierte en decibelios usando dBtf = 10log10 (Stfacercaf), donde Stf es el espectro en el tiempo t y la frecuencia f y mSf es la gama media de todos los puntos de tiempo en la línea de fondo dentro de una banda de frecuencia11. Los poderes espectrales se calcularon para la línea base (300 ms antes de meter por la nariz), estímulo (100 ms), precámara (300 ms antes de entrar en la cámara) y acristalamiento (ms 600) tiempo. El análisis estadístico se realizó mediante una base de permutación no paramétrica t-test.
Como se muestra en la fila superior de la figura 2A, hubo una disminución en las bajas (4-12 Hz) y alta (45-85 Hz) energías de frecuencia en el ACC desde el inicio hasta el final del estímulo. Comparando el tiempo pasado fuera de la cámara con el tiempo en la cámara, el análisis espectral no mostró cambios en las actividades oscilatorias (como se ve en la fila superior de la figura 2B) en el ACC.
Oscilaciones de baja frecuencia en la OFC también mostraron disminuciones en el poder espectral mientras que los animales se acercó a la puerta de IR; sin embargo, esto apareció anteriores (-80 ms) y duró más tiempo en comparación con las oscilaciones de baja frecuencia en el ACC (50-420ms). Actividades (23-100 Hz) de la banda de frecuencias medias/altas en la OFC aumentaron después de la aparición del estímulo (figura 2A, fila inferior). No se observaron cambios significativos en las ventanas de tiempo de cámara anterior y cámara cuando estaban comparados juntos (figura 2B, fila inferior). Estos resultados están en consonancia con los resultados anteriores suponiendo que el OFC y ACC están involucrados en la toma de decisión basado en el valor2,12,13.
Figura 1: esquema de una elección en una tarea de toma de decisiones basada en el retraso de. El laberinto medidas 60 cm x 10 cm x 40 cm. La caja de inicio está conectada al brazo de arranque a través de una puerta retráctil. Dos otras puertas retráctiles (puerta-A y puerta-B) se colocan en cada brazo de objetivo y juntos hacen una cámara para demorar el acceso de los animales a las recompensas. Puerta-A se coloca 12,5 cm desde el punto de entrada a cada brazo y puerta-B se coloca justo antes de la comida bien, 5 cm desde el extremo del brazo. Un alimento metal levantado bien, 3 cm de diámetro, se coloca en el extremo de cada brazo de la meta, 2 cm por encima del piso del laberinto.
El animal se coloca en el cuadro de inicio y se le permite acercarse y nariz-poke la puerta infrarroja (IRB-1) para activar el estímulo auditivo que la HRA de señales (en este panel, el brazo derecho). La fecha y hora IRB - 2L y 2R IRB elección del animal. Si el animal da vuelta derecha, A la puerta se abre para permitir que el animal Introduzca el brazo (cámara) y se cierra inmediatamente después de que el animal entra en. Después de 15 s, B la puerta se abre para dar el acceso de animales a la recompensa. Si el animal decide girar a la izquierda, (A la puerta se abre en el lado izquierdo), B de la puerta se abre inmediatamente después entra en el compartimiento izquierdo. La fecha y hora IRB - 3L y 3R IRB entrada del animal a la cámara.
Figura 2: dinámica Temporal y espectral de las actividades neuronales ACC y OFC. (A) este panel muestra tiempo-frecuencia parcelas de ACC (fila superior) y actividades neuronales OFC (fila inferior) en una acertada discriminación alta recompensa. Los poderes espectrales son normalizado base restando la ventana posterior sobresaliendo desde la ventana de tiempo de línea de base. El valor 0 en la abscisa denota la aparición del estímulo auditivo. (B) este panel muestra diagramas de tiempo-frecuencia del CAC (fila superior) y OFC (fila inferior) actividades neuronales cuando el animal entra en la cámara. La ventana de tiempo de cámara se normaliza por la ventana de tiempo de la cámara. El valor 0 en la abscisa denota el momento de apertura de puerta-A. Las bolsas de color representan la magnitud de los cambios espectrales en escala de decibelios. Los rectángulos negros demuestran desviaciones significativas del nivel de probabilidad (p < 0.05 por dos-prueba de permutación de cara). Haga clic aquí para ver una versión más grande de esta figura.
Habituación | Entrenamiento de la discriminación | Formación de retardo (5s) | Formación de retardo (10s) | Formación de retraso (15) | total | |
Rata 1 | 3 días | 15 días | 8 días | 6 días | 5 días | 37 días |
Rata 2 | 3 días | 18 días | 9 días | 6 días | 5 días | 41 días |
Rata 3 | 3 días | 13 días | 7 días | 5 días | 6 días | 34 días |
Rata 4 | 3 días | 15 días | 9 días | 6 días | 6 días | 39 días |
Rata de 5 | 3 días | 17 días | 8 días | 7 días | 5 días | 40 días |
Rata 6 | 3 días | 16 días | 7 días | 6 días | 6 días | 38 días |
Tabla 1: Variabilidad conductual y el curso del tiempo de aprendizaje de 6 ratas.
Roedores han sido utilizados en estudios neurocientíficos que tratan diferentes temas, desde las habilidades cognitivas como el aprendizaje y la memoria2,14 y comportamiento reforzado7,15,16 para el control central de órganos17,18 y Neurofarmacología19,20. El protocolo propuesto explica una tarea compleja de comportamiento adecuada para experimentos con Electrofisiología y de neuroimagen. Hemos descrito la tarea guiada reforzada basado en la demora para las ratas, pero puede ser adaptado para los ratones desde ratas y ratones realizan asimismo tareas de tierra seca.
Utilizamos asomando por la nariz como el estímulo para desencadenar un estímulo audio. Sin embargo, presionar la palanca y otras modalidades de estímulo tales como estímulos olfativos o visuales también pueden ser utilizados individualmente o simultáneamente. La tarea propuesta operante tiene un número de beneficios y ventajas sobre los métodos existentes no operante. Más convincente es la automática timestamping exacto del curso de las decisiones de los animales que, de otra manera, es muy difícil. El método está especialmente bien adaptado a los estudios de electrofisiología y de neuroimagen. Otra ventaja es eliminar los componentes espaciales de la tarea que requieren grupos de control de memoria espacial. Como una tarea muy exigente, es muy probable que no todas las ratas realizan bien en el paradigma. Vuelva a colocar el animal si permanece inactivo en el brazo de inicio, entrar en la zona de decisión para más de 5 minutos de retrasos o produce mayor error tarifas comparar a otros animales en el grupo.
En cualquier momento de decisión, los costos y valores de cualquier opción se supone que ser evaluadas simultáneamente. Por lo tanto, elegir HRA o ERS en esta tarea puede ser resultado de cambios en la codificación de los costos, en la codificación de los beneficios, o en el cálculo de costo-beneficio. Una advertencia del método propuesto es ser incapaz de discriminar entre los procesos de codificación.
Hay una serie de pasos que puede tomar para maximizar el éxito en el entrenamiento de los animales y sus señales electrofisiológicas de grabación. En primer lugar, el manejo de los animales antes del entrenamiento es crucial. Como las sesiones de grabación comienzan con conectar los cables de la grabación a etapa los animales, tratar de los aclimatar a que le permiten sostener su cabeza. Esto es muy importante, y con frecuencia manejan animales ansiosos a ser durante este procedimiento puede dañar la etapa de la cabeza o el cable de grabación. En general, animales bien manejados son menos estresado, más fáciles de trabajar con y tienden a producir menos variables datos.
En segundo lugar, roedores dejan una variedad de señales de odorante en el laberinto (es decir, que contiene la feromona orina y heces, secretan las feromonas de su región de la barba y en los fluidos de sus almohadillas de pie). Por lo tanto, el laberinto tiene que limpiarse después de cada uso individual y en la conclusión de un experimento para minimizar el impacto de estas moléculas de olor residual en los resultados de la prueba. Etanol (70%) es un desinfectante común utilizado para limpiar equipo de prueba. Sin embargo, como muchos desinfectantes, alcohol sí mismo tiene un olor que puede influir el comportamiento de roedor. Por lo tanto, asegúrese de que ha evaporado completamente antes de colocar un animal en el laberinto.
En tercer lugar, aunque son menos sensibles al ruido que picos LFPs, utilizando conectores sólidos y un cable bien asegurado disminuye el nivel de ruido de movimiento. Rociando ligeramente con agua en el piso del laberinto puede disminuir la electricidad estática que se crea por la fricción entre la piel del animal y la superficie del piso.
En conclusión, el protocolo descrito en este artículo puede ayudar a diseñar experimentos de toma de decisiones reforzados base de retardo y registrar señales electrofisiológicas mientras el animal está realizando la tarea.
Los autores no tienen nada que revelar.
Esta investigación fue apoyada por la Fundación de Neurociencias de RMH, Australia; la Fundación australiana del cerebro; la RACP Thyne Reid beca, Australia; y por un proyecto del Consejo de tecnologías, Irán a Abbas Haghparast y ciencias cognitivas.
Name | Company | Catalog Number | Comments |
T-maze | Self made | ||
Dustless Precision Sugar Pellets | TSE Systems Intl. Group | F0023 | 45 mg, Sucrose |
Ketamine Hydrochloride Injection, USP | Sigma-Aldrich | 6740-87-0 | |
Xylazine | Sigma-Aldrich | 7361-61-7 | |
stereotaxic device | Stoelting | ||
Isofluran | Santa Cruz Biotechnology | sc-363629Rx | |
PFA-coated stainless-steel wires | A-M systems | ||
acrylic cement | Vertex, MA, USA | ||
(wooden or PVC (polyvinyl chloride)-made) | local suppliers | ||
Mini-Fit Power Connector | Molex | 15243048 | |
ethannol 70% | Local suppliers | ||
buprenorphine | diamondback drugs | ||
Arduino UNO | Arduino | https://www.arduino.cc/ | |
Infrared emitting diode | Sharp | GL480E00000F | http://www.sharp-world.com/ |
Chronux Toolbox | Chronux.org | ||
Arduino codes | https://github.com/dechuans/arduino-maze |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados