Method Article
Uma análise de custo-benefício é uma abordagem de escala pesando que o cérebro executa no decurso da tomada de decisão. Aqui, propomos um protocolo para treinar os ratos em uma paradigma de tomada de decisão baseada em operante onde ratos escolhem maiores recompensas em detrimento à espera de 15 s para recebê-los.
Tomada de decisão orientada para o reforço é a capacidade de escolher entre concorrentes cursos de ação com base no valor relativo dos benefícios e suas consequências. Este processo é parte integrante do comportamento humano normal e foi mostrado para ser interrompida por desordens neurológicas e psiquiátricas como vício, esquizofrenia e depressão. Roedores têm sido muito utilizados para descobrir a neurobiologia da cognição humana. Para este efeito, foram desenvolvidas várias tarefas comportamentais; no entanto, a maioria é não-automatizados e é trabalhosas. O desenvolvimento recente do microcontrolador aberto permitiu aos investigadores automatizar tarefas baseadas em operante para avaliar uma variedade de tarefas cognitivas, padronizar a apresentação do estímulo, melhorar a gravação de dados e consequentemente, melhorar a a saída da pesquisa. Aqui, descrevemos uma baseado em atraso orientada para o reforço de decisão tarefa automatizada, usando um operante ZIF controlado por programas de software personalizados. Usando essas tarefas de tomada de decisão, nós mostramos as mudanças nas atividades potenciais locais de campo no córtex cingulado anterior de um rato enquanto ele executa uma tarefa de tomada de decisão baseada em atraso e custo-benefício.
Tomada de decisão é o processo de reconhecimento e selecionando opções com base nos valores e preferências do tomador de decisão e as consequências da ação selecionada1. Embora a tomada de decisão foi estudada extensivamente em campos diferentes (ou seja, economia, psicologia e neurociência), mecanismos neurais subjacentes a tais habilidades cognitivas não são ainda totalmente compreendidos. Duas subcategorias de tomada de decisão são perceptivas de tomada de decisões e tomada de decisão orientada por reforço. Embora eles incorporam conceitos e elementos de sobreposição consideráveis, perceptual de tomada de decisões se baseia em informações sensoriais disponíveis1,2, Considerando que a tomada de decisões guiadas reforço lida com o valor relativo de ações adquirida ao longo de uma escala de tempo específico3. Um aspecto importante do processo de decisão reforçado é a análise de custo-benefício que é intuitivamente realizada pelo cérebro computação os benefícios das escolhas determinados e subtraindo os custos associados de cada alternativa1.
A ZIF (ou a variante Y-labirinto) é um dos labirintos mais utilizados em experiências cognitivas usando roedores. Os animais são colocados no início (a base do T) braço e autorizados a escolher o braço de gol (um dos braços do lado). Tarefas como uma alternância forçada ou discriminação esquerda-direita são usadas principalmente com roedores na ZIF para testar a memória de referência e trabalho4. T-labirintos são também amplamente utilizados em experiências de tomada de decisão5,6,7. O design mais simples, a recompensa é colocada no braço de apenas um gol. A escolha é previsível, e os animais certamente preferiria a recompensa ao invés de nada, independentemente do valor da recompensa. Outra opção é colocar recompensas em ambos os braços do objetivo e então deixar os animais uma escolha de qual caminho tomar, dependendo de vários parâmetros(ou seja, a preferência natural do animal, a diferença do valor das recompensas e os custos a pagar). Na concepção baseada em valor, a tarefa é mais complicada por ter propriedades de escala pesando. Desta forma, um animal recebe recompensas valorizadas de forma diferente, escolhendo entre as duas alternativas, bem como entre os custos das ações [ou seja, a quantidade de espera (baseado em atraso) ou a quantidade de esforço (baseada no esforço) necessários para receber recompensas], cada contribuindo para a decisão que é feita de5,6.
Tradicional baseado em atraso ZIF na tomada de decisão, os animais são treinados para selecionar o braço de alta recompensa (HRA) e evitar o oposto braço baixa recompensa (LRA). Os lados do HRA e LRA permanecem inalterados durante todo o experimento. Embora a tarefa descrita acima tem sido bem documentada na literatura, sofre várias desvantagens processuais. Em primeiro lugar, por ter um braço de objetivo fixo, o animal sabe qual braço escolher desde o início de cada julgamento. Neste cenário, animais podem selecionar o braço objetivo baseado na sua memória, em vez de tomada de decisão. Portanto, em um paradigma de tomada de decisão baseada em atraso, se um animal seleciona a recompensa baixa por causa da intervenção de estudo, não ficará claro se isto é devido a uma perda de memória ou para a estudo de intervenção. Pode ser considerado um grupo de controle de memória para segregar o comportamento observado com o problema de memória, mas isto encargos pesquisadores e animais parecidos devido o trabalho adicional de7. Uma segunda preocupação é o momento de tomada de decisão pelo animal: uma vez animais chegarem à zona de decisão (a junção de todas as três armas), eles geralmente olhar à esquerda e à direita, pesar os custos e benefícios em relação a cada braço e então tomar sua decisão. No entanto, após alguns ensaios, executar tal um cálculo antes de chegar na zona de decisão e simplesmente vão directamente para o braço de recompensa. Como resultado, estes dois inconvenientes — um pre-viés para um braço e encontrar o momento de tomada de decisão — ambos altamente interromper a interpretação de eletrofisiológicos e dados de neuroimagem.
No método explicado neste artigo, o braço preferencial (HRA) é preparado por um sinal auditivo e pode variar de um julgamento para o julgamento. Animais iniciar os ensaios ao entrar na zona de teste (Figura 1) e acionar o sinal auditivo pelo "nariz-cutucando" uma porta de infravermelha que foi colocada na junção das três armas. O sinal de áudio (20 dB, entre 500 e 1.000 ms) é jogado de um alto-falante no final do braço do objetivo.
Todos os procedimentos explicados aqui foram aprovados e realizados em conformidade com o guia para o cuidado e o uso de animais de laboratório e foram aprovados pelo Comitê de ética do Animal Florey Instituto ou centro de pesquisa da neurociência.
1. habitação, manipulação e restrição alimentar
2. experimental set-up
3. habituação ao labirinto
4. discriminação formação
5. atraso formação
6. eletrofisiologia (fabricação de eletrodos)
7. anestesia
8. ato cirúrgico
9. após o procedimento formação
Os dados aqui apresentados são a LFP gravado do córtex orbitofrontal esquerdo (OFC) e o córtex cingulado anterior (ACC) de seis ratos machos Wistar utilizando eletrodos bipolares (do PFA revestido de aço inoxidável). A tabela 1 mostra o comprimento de aquisição comportamentais para cada fase de treinamento. As coordenadas para os locais de destino foram determinados de um rat brain atlas9 e são os seguintes: para a AAC, 1,2 mm anterior o bregma, 0,8 mm lateral à linha média e 2mm ventral do crânio; e para o OFC, 3,5 mm à frente do bregma, 2,3 mm lateral à linha média e ventral do crânio 5,4 mm.
As gravações foram filtrados bandpass (0,01 - 250 Hz) para extrair LFPs e em seguida amostragem a 1.000 Hz. A análise espectral foi realizada em LFPs usando o multi do atarraxamento10. Cinco Slepian atarraxamentos e um produto de tempo-largura de banda de três foram usados para alcançar a concentração óptima espectral. Tempo-frequência espectrogramas foram estimadas usando uma janela deslizante de 300 ms que foi deslocada sobre os dados em passos de 5 ms. Para uma melhor observação da modulação de tarefas dependentes dos poders espectrais e para atenuar o problema de poder-dimensionamento a 1/f, todos os espectrogramas foram base normalizada e convertido em decibéis usando dBtf = 10log10 (Stf/mSf), onde Stf é o espectro no tempo t e frequência f e mSf é o espectro médio de todos os pontos de tempo na linha de base dentro de uma banda de frequência11. Os poderes espectrais foram calculados para a linha de base (300 ms antes de nariz-cutucando), estímulo (100 ms), pré-câmara (300 ms antes de entrar na câmara) e janelas de tempo de câmara (600 ms). A análise estatística foi realizada utilizando um não-paramétricos baseados em permutação t-teste.
Como mostrado na linha superior da Figura 2A, houve uma diminuição em ambos a baixa (4-12 Hz) e os altos (45-85 Hz) poderes de frequência da CCA desde o início até o fim do estímulo. Não comparando o tempo gasto fora da câmara, com o tempo, na câmara, a análise espectral mostrou nenhuma alteração nas atividades oscilatórias (como visto na linha superior da Figura 2B) no ACC.
Oscilações de baixa frequência no OFC também mostraram diminuições nos poderes espectrais enquanto os animais que se aproximava do portão de IR; no entanto, este apareceu mais cedo (ms-80) e durou mais tempo comparado com as oscilações de baixa frequência da CCA (50-420ms). Atividades de médio/alta frequência banda (23-100 Hz) no OFC aumentaram após o aparecimento do estímulo (Fig. 2A, linha inferior). Não foram observadas alterações significativas nas janelas de tempo pré-câmara e câmara quando eram comparados juntos (Fig. 2B, linha inferior). Estes resultados estão de acordo com as conclusões anteriores, supondo que o OFC e ACC estão ambos envolvidos na tomada de decisão baseada em valor2,12,13.
Figura 1: esquemático de uma escolha experimental em uma tarefa de tomada de decisão baseada em atraso. O labirinto mede 60 cm x 10 cm x 40 cm. A caixa de início está conectada para o início do braço através de uma porta retrátil. Duas outras portas retráteis (porta-A e porta-B) são colocados em cada braço do gol e juntos eles fazem uma câmara para atrasar o acesso dos animais a recompensas. Porta-A é colocada 12,5 cm do ponto de entrada para cada braço e porta-B é colocado antes da comida bem, 5 cm da extremidade do braço. Um alimento de metal levantado bem, 3 cm de diâmetro, é colocado na extremidade de cada braço do gol, 2 cm acima do piso do labirinto.
O animal é colocado na caixa início e é permitido se aproximar e nariz-picar o portão infravermelho (IRB-1) para acionar o estímulo auditivo que sugestões o HRA (neste painel, o braço direito). O IRB - 2L e IRB-2R timestamp escolha do animal. Se o animal transforma certo, porta-A é aberto para permitir que o animal entrar no braço (câmara) e é fechado imediatamente depois que o animal entra. Depois de 15 s, porta-B é aberto para permitir o acesso do animal para a recompensa. Se o animal escolhe para virar à esquerda, (porta-A é aberta no lado esquerdo), porta-B é aberto imediatamente depois que ele entra na câmara esquerda. O IRB - 3L e IRB-3R timestamp entrada do animal para a câmara.
Figura 2: dinâmica espectral e Temporal de atividades neurais ACC e OFC. (A), este painel mostra parcelas de tempo-frequência de ACC (linha superior) e OFC (linha inferior) de atividades neurais durante uma discriminação de alta-recompensa bem sucedida. O poder espectral está normalizado de base subtraindo-se a janela de tempo pós-picar da janela da linha de base de tempo. O valor 0 na abcissa denota o aparecimento do estímulo auditivo. (B), este painel mostra parcelas de tempo-frequência de ACC (linha superior) e OFC (linha inferior) atividades neurais, quando o animal entra na câmara. A janela de tempo de câmara é normalizada pela janela de tempo pré-câmara. O valor 0 na abcissa denota o tempo de abrir a porta. Os sacos de cor retratam a extensão das alterações espectrais na escala de decibéis. Os retângulos pretos demonstram desvios significativos do nível de oportunidade (p < 0.05 por dois-teste de permutação de frente e verso). Clique aqui para ver uma versão maior desta figura.
Habituação | Treinamento de discriminação | Formação de atraso (5s) | Formação de atraso (10s) | Formação de atraso (15) | total | |
Rato 1 | 3 dias | 15 dias | 8 dias | 6 dias | 5 dias | 37 dias |
Rato 2 | 3 dias | 18 dias | 9 dias | 6 dias | 5 dias | 41 dias |
Rato 3 | 3 dias | 13 dias | 7 dias | 5 dias | 6 dias | 34 dias |
Rato 4 | 3 dias | 15 dias | 9 dias | 6 dias | 6 dias | 39 dias |
Rato 5 | 3 dias | 17 dias | 8 dias | 7 dias | 5 dias | 40 dias |
Rato 6 | 3 dias | 16 dias | 7 dias | 6 dias | 6 dias | 38 dias |
Tabela 1: Variabilidade comportamental e o curso do tempo de aprendizagem para 6 ratos.
Roedores têm sido muito utilizados em estudos neurocientíficos que lidam com temas diferentes, desde as habilidades cognitivas como a aprendizagem e memória2,14 e comportamento reforçado7,15,16 para o controle central de órgãos17,18 e Neurofarmacologia19,20. O protocolo proposto, explicou uma tarefa complexa e comportamental adequada para experimentos envolvidos com eletrofisiologia e neuroimagem. Descrevemos a tarefa de baseados em atraso reforçada guiada para ratos, mas pode ser adaptado para os ratos desde ratos e camundongos faça da mesma forma em tarefas de terra seca.
Usamos o nariz-cutucando como o estímulo para desencadear um estímulo áudio. No entanto, alavanca-prensagem e outras modalidades de estímulo como estímulos visuais ou olfativas também podem ser usado, individualmente ou simultaneamente. A tarefa proposta operante tem uma série de benefícios e vantagens sobre os métodos existentes não-operante. Mais convincente é o carimbo de hora preciso automático do curso das decisões dos animais que, de outra forma, é muito difícil. O método é especialmente adequado para estudos de eletrofisiologia e neuroimagem. Outra vantagem é remover os componentes espaciais da tarefa que exigem grupos de controle de memória espacial. Como uma tarefa altamente exigente, é bastante provável que nem todos os ratos executam bem sobre o paradigma. Substitua o animal se ficar inactivo no braço iniciar, entrar na zona de decisão, por mais de 5 min de atrasos ou produz maior erro taxas comparam com outros animais no grupo.
A qualquer momento de decisão, os custos e valores de qualquer escolha são assumidos como ser avaliada simultaneamente. Portanto, escolher o HRA ou LRA nesta tarefa pode ser resultados de mudanças na codificação dos custos, na codificação dos benefícios, ou com o cálculo de custo-benefício. Uma limitação do método proposto está sendo incapaz de discriminar entre os processos de codificação.
Há uma série de etapas que podem ser tomadas para maximizar o sucesso na formação dos animais e seus sinais eletrofisiológicos de gravação. Em primeiro lugar, a manipulação dos animais antes do treinamento é crucial. Como as sessões de gravação iniciar com ligar os fios de gravação, a cabeça estágio do animal, tente aclimatá-los para que eles permitem que você mantenha a sua cabeça. Isto é muito importante, como raramente tratados animais tornam-se ansiosos durante este procedimento e pode danificar o cabeça-palco ou o cabo de gravação. Geralmente, os animais bem manuseados são menos estressado, mais fácil de trabalhar com e tendem a produzir menos variáveis dados.
Em segundo lugar, roedores deixam para trás uma variedade de sugestões de odorante no labirinto (isto é, contendo feromônio de urina e fezes, secretam feromônios de sua região da Suiça e em líquidos de suas almofadas do pé). Portanto, o labirinto precisa de ser limpo após cada uso individual e na conclusão de uma experiência para minimizar o impacto destas moléculas odorant residual nos resultados dos testes. Etanol (70%) é um desinfetante comum usado para limpar o equipamento de teste. No entanto, como muitos desinfetantes, álcool em si tem um odor que pode influenciar o comportamento de roedor. Portanto, certifique-se que que evapore totalmente antes de colocar um animal dentro do labirinto.
Em terceiro lugar, embora LFPs são menos sensíveis ao ruído do que picos, usar conectores sólidas e um cabo bem protegido diminui o nível de ruído de movimento. Levemente, pulverizar água no chão labirinto pode diminuir a eletricidade estática que é criada pela fricção entre a pele do animal e a superfície do piso.
Em conclusão, o protocolo descrito neste artigo pode ajudar a projetar baseado em atraso reforçadas experiências de tomada de decisão e registar sinais eletrofisiológicos, enquanto o animal está realizando a tarefa.
Os autores não têm nada para divulgar.
Esta pesquisa foi apoiada pela Fundação de neurociência RMH, Austrália; a Fundação australiana do cérebro; o RACP Thyne Reid Fellowship, Austrália; e por um projeto de concessão da ciências cognitivas e do Conselho de tecnologias, Irã de Abbas Haghparast.
Name | Company | Catalog Number | Comments |
T-maze | Self made | ||
Dustless Precision Sugar Pellets | TSE Systems Intl. Group | F0023 | 45 mg, Sucrose |
Ketamine Hydrochloride Injection, USP | Sigma-Aldrich | 6740-87-0 | |
Xylazine | Sigma-Aldrich | 7361-61-7 | |
stereotaxic device | Stoelting | ||
Isofluran | Santa Cruz Biotechnology | sc-363629Rx | |
PFA-coated stainless-steel wires | A-M systems | ||
acrylic cement | Vertex, MA, USA | ||
(wooden or PVC (polyvinyl chloride)-made) | local suppliers | ||
Mini-Fit Power Connector | Molex | 15243048 | |
ethannol 70% | Local suppliers | ||
buprenorphine | diamondback drugs | ||
Arduino UNO | Arduino | https://www.arduino.cc/ | |
Infrared emitting diode | Sharp | GL480E00000F | http://www.sharp-world.com/ |
Chronux Toolbox | Chronux.org | ||
Arduino codes | https://github.com/dechuans/arduino-maze |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados