Lernen als angewandte Statistik
Posted on | November 10, 2006 | No Comments
Ein Post machte neugierig:
Google has built an English translation tool for Chinese and Arabic texts — using a team that speaks neither of the two languages. The system, which last week topped an international exercise to find the best Chinese and Arabic translation technology, is symbolic of a shift in approach to computer translation.
(im Blog Lingformant)
Wie geht denn sowas? Als ich dann auf den verlinkten Nature-Artikel ging, wurde das Vorgehen des Programms klar:
Im Prinzip funktioniert das Teil ganz simpel: Statt – wie bisher üblich – die Regeln und die Lexik zu programmieren und so manchmal recht komische Übersetzungen zu erzeugen, verfolgt das Team eine ganz andere Strategie. Es vergleicht Dokumente, die sowohl in Chinesisch/Arabisch als auch auf Englisch vorliegen. Am Anfang ist dies natürlich nicht sehr sinnvoll. Aber: Die Masse machts! Es ist davon auszugehen, dass nach dem Erreichen einer kritischen Masse die Übersetzungen relativ gut werden.
Das Prinzip des Lernens als angewandter Statistik (weiß irgendjemand eine zitierfähige Quelle dazu?) ist nicht neu: Zum ersten Mal stolperte ich bei der Parallel Distributed Processing-Gruppe um Rumelhart & McClelland über das Phänomen, dass ein neuronales Netz nach einem Training in seiner Wichtungsmatrix die statistische Verteilung der sprachlichen Oberflächenerscheinungen widerspiegelt.
Aber nicht nur im Konnektionismus lässt sich der Einfluss der Statistik finden. Schließlich ging es auf der diesjährigen Cognitive Science in Vancouver vor allem um die Bayes’sche Statistik (siehe Bayestheorem). Hier geht es um die Wahrscheinlichkeit einer Hypothese (oder Regel?) aufgrund der vorher angenommenen Wahrscheinlichkeit und der Erfahrungen, die man gesammelt hat.
Auch hat dieses Verfahren historische Vorläufe: Schließlich hat man die Hieroglyphen auch in einem ähnlichen Verfahren “entschlüsselt”. Der Stein von Rosetta trägt eine Inschrift in drei Sprachen (u.a. auch Altgriechisch). Es handelt sich dabei um einen Text mit zwei Übersetzungen. Durch Zuordnung der Hieroglyphen zu den anderen Texten konnten sie entschlüsselt werden.
Comments
Leave a Reply
| M | D | M | D | F | S | S |
|---|---|---|---|---|---|---|
| « Dez | ||||||
| 1 | 2 | 3 | 4 | 5 | ||
| 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 13 | 14 | 15 | 16 | 17 | 18 | 19 |
| 20 | 21 | 22 | 23 | 24 | 25 | 26 |
| 27 | 28 | 29 | ||||
Private Webseite!
Bitte beachten Sie, dass es sich bei dieser Seite um meine private Webseite handelt. Wenn Sie mehr über meine Arbeit erfahren wollen, besuchen Sie bitte:
www.martin-doepel.de und das darauf befindliche Blog!
Keine Werbung!
Kategorien
- Affen (2)
- Allgemein (28)
- Bücher (7)
- Bildung (10)
- eLearning (1)
- Evolution (7)
- Film (9)
- Foto (13)
- Gehirn (11)
- Gesellschaft (66)
- häh? (17)
- Information (6)
- Internet (46)
- Katrin (1)
- Kognition (4)
- komisch (14)
- Konnektionismus (1)
- Leute (14)
- Linktipps (37)
- Medien (17)
- Meinung (4)
- Mensch (44)
- Orte (1)
- Podcasting (3)
- privat (20)
- Publikationen (1)
- Rezepte (2)
- Singapur (11)
- SlowFood (1)
- Sprache (5)
- Spracherwerb (1)
- studiod (1)
- TV (3)
- Vlog (1)
- Web2.0 (21)
- Wissenschaft (42)
- witzig (42)
Archives
Skype Online Status
I am reading
![]() |
Schlagwörter
My twitter news
- Audioboo: example http://t.co/AzX6roIU
- @mrbrown QR can be good (if used properly). There are free scan apps and QR can also contain texts, not URLs. Interesting for educators.
- Mine too. RT @stevekatz: What's your favorite productivity tool? Mine is Evernote. http://t.co/v7n8uoBc
- RT @Deming14Points: "Grading of pupils in school is an attempt to produce quality by inspection. As a way of life, it does not work." - ...






