Fehlerkorrekturmechanismen beim Sprachenlernen: Modellierung von Individuen Teil 1
Nov 09, 2023
Abstrakt:
Seit seiner ersten Anwendung als Rechenmodell für das Sprachenlernen haben sich Beweise dafür angesammelt, dass das Rescorla-Wagner-Fehlerkorrekturlernen (Rescorla und Wagner, 1972) mehrere Aspekte der Sprachverarbeitung erfasst. Während frühere Studien die Rescorla-Wagner-Regel allgemein unterstützt haben, indem sie sie zur Erklärung des Verhaltens von Teilnehmern bei einer Reihe von Aufgaben verwendet haben, konzentrieren wir uns auf das Testen der vom Modell generierten Vorhersagen in einer kontrollierten Lernaufgabe in natürlicher Sprache und modellieren die Daten auf der Ebene von der einzelne Lernende.
Es besteht ein enger Zusammenhang zwischen Sprachenlernen und Gedächtnis. Wenn wir eine neue Sprache lernen, müssen wir nicht nur die Grammatik und den Wortschatz beherrschen, sondern uns auch viele Wörter und Ausdrücke merken. Daher spielt das Gedächtnis eine wichtige Rolle im Sprachlernprozess.
Das Erlernen einer Sprache kann das Gedächtnis stärken. Viele Studien haben gezeigt, dass das Erlernen einer neuen Sprache die neuronale Aktivität im Gehirn anregen, den Stoffwechsel in der Großhirnrinde fördern und dadurch das Gedächtnis stärken kann. Das Erlernen einer neuen Sprache kann auch das neuronale Netzwerk des Gehirns stimulieren, es gesünder machen und die kognitiven Fähigkeiten, die Intelligenz und das logische Denken verbessern.
Das Erlernen einer Sprache erfordert Wiederholung und Übung. Die häufige Verbindung von Sprechen, Zuhören und Lesen kann den Eindruck vertiefen und die Dinge einprägsamer machen. Gleichzeitig können wir uns durch die Kommunikation mit anderen neue Wörter und Sätze besser merken, etwas über verschiedene Sprachumgebungen und Kulturen lernen und unser Verständnis der Sprache weiter vertiefen.
Das Erlernen einer Sprache ermöglicht uns auch, unsere Denkweise zu ändern, steigert die Denkflexibilität und Kreativität und verbessert das Gedächtnis weiter. Gleichzeitig können wir auch Sprachenlernen und Gedächtnistraining durchführen, indem wir Musik hören, Filme schauen, chinesische und ausländische Literatur lesen usw., auf unterschiedliche Weise lernen und beim Lernen spielen, um den Lernprozess interessanter zu gestalten und das Lernen zu steigern Interesse wecken und das Gedächtnis verbessern.
Daher können wir beim Erlernen einer Sprache verschiedene Methoden zum Üben anwenden, uns auf Gedächtnisaktivitäten und -übungen konzentrieren, Lernmethoden und -methoden ständig erneuern und das Gedächtnistraining stärken, um die Lerneffekte und das Gedächtnis zu verbessern. Es ist ersichtlich, dass wir unser Gedächtnis verbessern müssen. Cistanche deserticola kann das Gedächtnis erheblich verbessern, da Cistanche deserticola ein traditionelles chinesisches Arzneimittel mit vielen einzigartigen Wirkungen ist, darunter die Verbesserung des Gedächtnisses. Die Wirksamkeit von Hackfleisch beruht auf den vielen darin enthaltenen Wirkstoffen, darunter Säure, Polysaccharide, Flavonoide usw. Diese Inhaltsstoffe können die Gesundheit des Gehirns auf verschiedene Weise fördern.

Klicken Sie auf 10 Möglichkeiten zur Verbesserung des Gedächtnisses
Indem wir die Parameter des Modells so anpassen, dass sie zu den Verhaltensentscheidungen der Teilnehmer bei jedem einzelnen Versuch passen, anstatt ein Eins-für-alles-Modell mit einem einzigen Satz von Standardparametern anzupassen, zeigen wir, dass das Modell die Entscheidungen der Teilnehmer, die Zeitverzögerungen, und Grad der Antwortübereinstimmung. Wir zeigen auch, dass Geschlecht und Arbeitsgedächtniskapazität das Ausmaß beeinflussen, in dem das Rescorla-Wagner-Modell das Sprachenlernen erfasst.
Schlüsselwörter
Sprachen lernen; Fehlerkorrekturlernen; Rescorla-Wagner-Modell; Morphologie; Vereinbarung.
Einführung
Wir Menschen teilen mit anderen Arten viele zentrale Lernmechanismen, die es uns ermöglichen, uns an unsere Umwelt anzupassen (Rescorla, 1988). Zu diesen Mechanismen gehören unter anderem klassische Konditionierung (d. h. Pawlowsche Konditionierung; Pawlow, 1927), instrumentelle Konditionierung (auch operante Konditionierung; Skinner, 1938) und Formen des sozialen Lernens, wie z. B. stellvertretendes Lernen (Bandura, 1962).
Die einzigartigste menschliche Lernfähigkeit ist das Sprachenlernen, das auch eine effiziente generationsübergreifende Weitergabe umfasst und für soziale Inklusion und Zusammenhalt von grundlegender Bedeutung ist. Während die Mechanismen des Kernlernens jedoch relativ gut verstanden sind, bleibt das Sprachenlernen ein großes Rätsel (Ambridge & Lieven, 2011). Ein früher Versuch von Skinner (1957), das Sprachenlernen anhand derselben Prinzipien zu erklären, die auch für kognitive Aufgaben auf niedrigerem Niveau gelten, wurde von Chomsky (1959) verworfen.
Für den Großteil des restlichen 20. Jahrhunderts wurde Sprache als ein im Großen und Ganzen angeborenes System angesehen, das von Regeln beherrscht und von einer einzigartig menschlichen und spezialisierten kognitiven Struktur verwaltet wird. Diese Struktur wurde ursprünglich als Hilfsmittel zum Spracherwerb konzipiert und später zur universellen Grammatik erweitert.
Diese vorherrschende Ansicht wurde von zwei Seiten gleichzeitig in Frage gestellt. Das Aufkommen der gebrauchsbasierten Linguistik in den 1980er Jahren (Langacker, 1987) förderte eine Sichtweise der Sprache als dynamisches und probabilistisches System, das aus allgemeinen kognitiven Fähigkeiten resultiert, die auf Spracheingaben einwirken (Dabrowska & Divjak, 2015). Diese Ansicht passte gut zu konnektionistischen Rahmenwerken, die zeigten, dass regelartiges Verhalten allein durch die Einwirkung des Gebrauchs entstehen kann und dass Sprachkenntnisse empfindlich auf die Eigenschaften der Eingabe reagieren (Plaut & Gonnerman, 2000; Seidenberg & McClelland, 1989). '
Der Konnektionismus ebnete wohl auch den Weg für Veränderungen in der Theoriebildung hin zu einer Sichtweise, dass Sprache wie jede andere Fähigkeit erlernt wird, und in den frühen 2000er Jahren begann die Wiedereingliederung der Grundprinzipien des Lernens in die Arbeit über Sprache (siehe z. B. Bybee & McClelland, 2005; für aktuellere Arbeiten siehe Ellis et al., 2016, das sich sowohl mit dem Erlernen der ersten als auch der zweiten Sprache befasst, sowie Chuanget al., 2021, das sich mit dem lexikalischen Erwerb in der zweiten und dritten Sprache befasst. Man ging nun davon aus, dass Sprache denselben allgemeinen kognitiven Fähigkeiten und Lernmechanismen zugänglich ist, die Menschen und Tiere nutzen, um in ihrer Umgebung zu navigieren und sich an sie anzupassen (vgl. Ellis, 2006a; Ellis & Sagarra, 2010, 2011; Sturdy & Nicoladis, 2017). .

Unter diesen Lernmodellen zeichnet sich das Modell der klassischen Konditionierung von Rescorla und Wagner (1972) durch seine Einfachheit und seine Fähigkeit aus, eine Reihe empirischer Lernphänomene zu erklären (Siegel & Allan, 1996). Dieses Modell ist biologisch plausibel (Chen et al., 2008) und hat einen evolutionären Vorteil gegenüber anderen leistungsfähigeren Lernmechanismen, da es im Vergleich zu anderen plausiblen Lernmechanismen eine höhere Wahrscheinlichkeit hat, auf natürliche Weise ausgewählt zu werden und im Evolutionsprozess zu bestehen (mehr dazu). Einzelheiten siehe Trimmer et al., 2012).
Hintergrundliteratur
Das Rescorla-Wagner-Modell
Als Modell der klassischen Konditionierung befasst sich das Rescorla-Wagner-Modell (R–W) mit Situationen, in denen eine Entität (ein Mensch, ein Tier oder eine Maschine) die prädiktive Beziehung zwischen Objekten und/oder Ereignissen (d. h. Hinweisen und Zeichen) lernen muss Ergebnisse) in einer Umgebung, und wo Hinweise um ihren Vorhersagewert für ein Ergebnis konkurrieren, während die Lern- (oder Assoziations-)Gewichte iterativ (neu) kalibriert werden. Genauer gesagt spiegelt ein Assoziationsgewicht die Tendenz eines Ergebnisses wider, bei Vorhandensein eines bestimmten Hinweises einzutreten. Ein höherer positiver Assoziationsgewichtswert für ein bestimmtes Ergebnis entspricht einer höheren Wahrscheinlichkeit des Auftretens dieses Ergebnisses bei Vorhandensein des Hinweises; Umgekehrt entspricht ein stark negativer Wert einer größeren Wahrscheinlichkeit, dass dieses Ergebnis nicht eintritt (der Hinweis wird in diesem Fall als hemmend bezeichnet). Werte nahe Null bedeuten eine geringe Wahrscheinlichkeit, das Ergebnis zu beobachten (bei positivem Gewicht) oder zu verhindern (bei negativem Gewicht).
Das R-W-Modell geht davon aus, dass der Organismus eine einfache fehlerkorrigierende Lernregel berechnet, die zur Aktualisierung der Assoziationsgewichte bei jedem neuen Lernereignis (z. B. jedem Versuch in einem Verhaltensexperiment) verwendet wird. Die allgemeine Idee hinter der Korrekturregel ist, dass der Zusammenhang zwischen einem Hinweis und einem Ergebnis (a) verstärkt wird, wenn sowohl Hinweis als auch Ergebnis im Lernereignis vorhanden sind, (b) geschwächt wird, wenn der Hinweis vorhanden ist, das Ergebnis jedoch nicht, und (c ) bleibt gleich, wenn der Hinweis selbst fehlt.
Die Aktualisierung der Assoziationsgewichte wird durch die Diskrepanz zwischen dem erwarteten und dem erhaltenen Ergebnis gesteuert, sodass die Größe der Aktualisierung – wie stark die Assoziationsgewichte angepasst werden – durch zwei Parameter, sogenannte Lernraten, und die Richtung der Aktualisierung – ob sie zunimmt – bestimmt wird das Gewicht oder verringert es – hängt vom Vorzeichen der Differenz zwischen dem erwarteten und dem beobachteten Ergebnis ab. Auf diese Weise geht es beim R-W-Modell ganz allgemein um die Ergebnisse, und dies unterscheidet es von verwandten Modellen, bei denen es beim Lernen um die Eingabesignale geht (z. B. Pearce & Hall, 1980).
Ein weiteres Merkmal des R-W-Modells besteht darin, dass die Ergebnisse zwar unabhängig voneinander aktualisiert werden, Eingabehinweise jedoch um die Vorhersagbarkeit der Ergebnisse konkurrieren.
Mit anderen Worten: Die Anpassung der Gewichte hängt nicht nur davon ab, dass der einzelne Hinweis aktualisiert wird, sondern von allen im Lernereignis vorhandenen Hinweisen durch ihre Summe der Assoziationsgewichte. Dieses Reizwettbewerbsprinzip ermöglichte es dem R-W-Modell, viele der rätselhaften Phänomene der klassischen Konditionierung zu erklären, von denen einige auch für das Verständnis der Mechanismen des Sprachenlernens wertvoll waren (eine Diskussion finden Sie im nächsten Abschnitt).1 Eines der bekanntesten Beispiele dafür Ein solches Lernphänomen ist der Blockierungseffekt (Kamin, 1969). Dieser Effekt tritt auf, wenn ein Hinweis in einer Verbindung mit einem zweiten Hinweis trainiert wird, um ein Ergebnis vorherzusagen, der zweite Hinweis jedoch bereits ein guter Prädiktor für das Ergebnis ist. In solchen Fällen kann der erste Hinweis keinen starken Zusammenhang mit dem Ergebnis herstellen (dh der erste Hinweis wird durch den zweiten Hinweis blockiert). Allgemeiner ausgedrückt führt das Prinzip des Reizwettbewerbs oft zu der Beobachtung, dass die besten Hinweise für das Ergebnis andere Hinweise daran hindern, eine starke Assoziation mit demselben Ergebnis zu entwickeln.
Das Rescorla-Wagner-Modell und Sprachenlernen
Seit seiner ersten Erwähnung in einem linguistischen Kontext durch Ellis (2006a) haben sich Belege dafür angehäuft, dass das R-W-Modell mehrere Aspekte des Sprachenlernens erfassen kann (z. B. Baayen et al., 2011; Ellis, 2006b; Milin, Divjak, &Baayen, 2017). ; Milin, Feldman, et al., 2017). Bisher stammen die verfügbaren empirischen Beweise aus Studien, die ein R-W-Modell trainieren, das Standardparameterwerte verwendet (hier beziehen wir uns auf die beiden Lernratenparameter, die zur Aktualisierung der Assoziationsgewichte nach jedem neuen Ereignis verwendet werden), typischerweise an einer kleinen Stichprobe aus Experimenten B. künstliche Sprachen oder einen großen Textkorpus.2 Anschließend werden Lernmaße nach dem Training aus dem simulierten Modell extrahiert und mit beobachteten Reaktionsmessungen einer experimentellen Aufgabe verglichen.
Das erste Problem besteht darin, dass Vorhersagen für (und von) solchen Modellen typischerweise unabhängig vom Experiment generiert werden (mit Ausnahmen wie den Studien von Ramscar & Yarlett, 2007, und Divjak et al., 2021, wo das Modell die experimentell zu testenden Hypothesen generierte). .
Die Parameter werden typischerweise auf ihre Standardwerte gesetzt, wodurch die Möglichkeit fehlt, die Variabilität zu berücksichtigen, die sich aus der Simulation des Modells mit unterschiedlichen Parameterwerten ergeben kann (siehe jedoch Olejarczuk et al., 2018, die feste Parameterwerte verwendeten, aber jedem ein separates Modell anpassten). Daten des Teilnehmers unter Verwendung der gleichen Beispielsequenz, auf die der Teilnehmer gestoßen ist). Die Einbeziehung der Variabilität, die sich aus den Modellparametern ergibt, bei der Anpassung von Lernmodellen an Sprachdaten hat das Potenzial, die Erklärbarkeit der im Experiment beobachteten individuellen Unterschiede zu verbessern, insbesondere da Sprachgebrauch und Sprachdarstellung ein Bereich sind, der große individuelle Variationen aufweist (Dabrowska, 2018). .

Das Trainieren des Modells auf einem groß angelegten Korpus ist mit noch höheren Kosten verbunden. Wir lassen hier das Problem der (fehlenden) Ähnlichkeit zwischen den Inhalten eines Korpus und den Eingaben, die Sprachbenutzer erhalten (was konvergente Evidenzstudien im Allgemeinen belastet; für eine Zusammenfassung) beiseite (Diskussion siehe Klavan & Divjak, 2016, und für Sammlungen bearbeiteter Beispiele siehe Divjak & Gries, 2012 und Gries & Divjak, 2012). Hier konzentrieren wir uns auf ein anderes Thema: Das Training an einem Korpus unterdrückt die beiden Hauptquellen der Variabilität des Modells – nämlich diejenigen, die mit der Wahl der Modellparameter und der Reihenfolge der Trainingsbeispiele zusammenhängen –, die meist in den frühen Phasen des Lernens aktiv sind (Shanks, 1995). ; siehe auch Milin et al., 2020, für eine allgemeinere Diskussion des Trial-Order-Effekts beim Fehlerkorrekturlernen).3 Diese frühen Verzerrungen, wie Ellis (2006a) sie nannte, stellen einen echten Test für das R-W-Modell davor dar kann als Modell für das Sprachenlernen in großem Maßstab eingesetzt werden. Die Modellierung der Parametervariabilität und das Training des R-W-Modells an denselben Beispielen, denen die Teilnehmer begegneten, stellen neue Möglichkeiten zum Verständnis des Sprachenlernens dar, die in früheren Studien noch nicht vollständig erforscht wurden.
Die vorliegende Studie
Ziel der vorliegenden Studie ist es, zu modellieren, wie einzelne Sprachlerner versuchsweise mit der jeweiligen Aufgabe umgehen, was eine sich wandelnde Herausforderung für die Anwendung des Diskriminierungs- oder Fehlerkorrekturlernens im Allgemeinen und des R-W-Modells auf das Sprachenlernen darstellt Insbesondere haben frühere Studien die R-W-Regel allgemein unterstützt, indem sie dieses Modell verwendet haben, um das Verhalten der Teilnehmer bei einer Reihe von Aufgaben zu erklären (Divjak, 2019; Milin & Blevins, 2020; Milin, Feldman, et al., 2017; Pirelli et al., 2020) konzentrieren wir uns auf das Testen der vom Modell generierten Vorhersagen in einer kontrollierten Lernaufgabe für natürliche Sprachen und modellieren die Daten auf der Ebene des einzelnen Sprachlerners. Dabei behandeln wir jeden Teilnehmer als eigenständige Lerneinheit, die über unterschiedliche Fähigkeiten verfügt, die entscheidend durch die Lernparameter des gewählten Modells formalisiert werden.
Angesichts der Tatsache, dass mehrere Studien berichtet haben, dass die klassische Konditionierungsleistung durch kognitive und persönliche Merkmale wie Arbeitsgedächtnis (Baetu et al., 2018; Sasaki, 2009), Geschlecht (Lonsdorfet al., 2015; Merz et al., 2018) beeinflusst werden kann, und Alter (z. B. Mutter et al., 2012) untersuchen wir auch, ob solche Merkmale die Einführung eines R-W-ähnlichen Mechanismus beim Sprachenlernen beeinflussen könnten.
Um diese Ziele zu erreichen und diese Fragen zu beantworten, haben wir eine vereinfachte Aufgabe zum Erlernen natürlicher Sprache entworfen: vereinfacht, um den Vorteil einer strengen empirischen Kontrolle zu nutzen, aber nur teilweise, um eine Verpflichtung zur ökologischen Gültigkeit aufrechtzuerhalten, indem ein naturalistischeres Spracheingabeerlebnis geboten wird. Die Aufgabe stellt in angemessenem Umfang dar, wie Menschen polnische Subjekt-Verb-Übereinstimmungszuordnungen durch natürlichen Umgang mit Beispielen lernen würden.
Wir schulten englische Muttersprachler anhand einer Reihe sorgfältig ausgearbeiteter Beispiele, die sowohl auditive als auch visuelle Dimensionen hatten und einige der Komplexitäten berücksichtigten, die der Subjekt-Verb-Übereinstimmung im Polnischen innewohnen. Als nächstes wählten wir für jeden Teilnehmer einzeln das am besten passende Modell aus (dh die Parameter, die zu der größten Übereinstimmung zwischen den Antworten des Teilnehmers und dem Modell führten) und verwendeten dabei dieselben Trainingsbeispiele, die der Teilnehmer kennengelernt hatte. Anschließend haben wir das R-W-Modell auf seine Fähigkeit untersucht, die Sprachwahl der Teilnehmer sowie ihre Zeitlatenzen wiederherzustellen, und es mit anderen plausiblen, aber regelbasierten Antwortstrategien verglichen. Schließlich haben wir getestet, ob kognitive und persönliche Merkmale wie Arbeitsgedächtniskapazität, Alter und Geschlecht das Ausmaß beeinflussen, in dem das R-W-Modell das Sprachenlernen erfasst.
Methode
Teilnehmer
66 Teilnehmer (Mdn.=20 Jahre; Spanne=18–65; 41 Frauen) nahmen im Austausch gegen einen Amazon-Gutschein im Wert von 7 £ an dem Experiment teil. Teilnehmer waren Studierende und Mitarbeiter der Universität. Alle von ihnen waren englische Muttersprachler ohne Kenntnisse der polnischen oder einer anderen slawischen Sprache, hatten normales oder auf normales Niveau korrigiertes Gehör und Sehvermögen und gaben keine Lernbehinderungen an. Die Teilnehmer hatten unterschiedliche Bildungshintergründe und viele von ihnen konnten andere Sprachen sprechen zusätzlich zu Englisch (die Verteilung der Bildungs- und Sprachhintergründe ist in Anhang S1 in den Hintergrundinformationen online dargestellt).
Materialien und Verfahren
Alle unsere Materialien, einschließlich Daten und Code, sind auf Github (https://github.com/ooominds/Error-correction-mechanisms-in-Languagelearning) und dem Open-Access-Repository der University of Birmingham, UBIRA (https:/) offen verfügbar. /doi.org/10.25500/edata.bham.00000911). Die Teilnehmer füllten drei Aufgaben und einen kurzen Fragebogen in der folgenden Reihenfolge aus: (a) eine Sprachlernaufgabe (Hauptaufgabe), (b) ein expliziter Wissens- und demografischer Fragebogen, (c) eine implizite Lernaufgabe und (d) ein Arbeitsgedächtnis ( WM)-Aufgabe. (Eine detaillierte Beschreibung jeder Aufgabe finden Sie im nächsten Abschnitt.)

Die Sprachlern- und impliziten Lernaufgaben wurden mithilfe von OpenSesame umgesetzt und den Teilnehmern präsentiert (Mathôt et al., 2012; Mathôt & March 2022). Der demografische Fragebogen wurde mit Google Forms präsentiert und die WM-Aufgabe mit Tatool verwaltet (von Bastian et al., 2013). Das Experiment wurde entweder einzeln oder, wann immer möglich, zu zweit in einem ruhigen Raum auf Intel Core i durchgeführt 7-8700 Computer mit Windows 10 und ausgestattet mit Iiyama G-Master 24.5-in. Monitore mit 59 Hz und einer Bildschirmauflösung von 1.920 × 1.080 Pixeln. Die Teilnehmer hörten die Hörreize über Bose QuietComfort 35 II-Kopfhörer mit Geräuschunterdrückung und registrierten ihre Reaktionen über eine Tastatur. Der Versuch dauerte etwa 50 Minuten.
For more information:1950477648nn@gmail.com






