Un modèle d'intelligence artificielle (IA) d'apprentissage en profondeur peut prédire les mots, fragments et phrases manquants à partir de tablettes cunéiformes qui ont jusqu'à 4500 XNUMX ans.
Les tablettes d'argile portant un texte cunéiforme en langue akkadienne sont des outils clés pour comprendre les cultures qui existaient en Mésopotamie (à peu près la région de l'Irak moderne) entre 2500 avant JC et 100 après JC. Beaucoup de ces tablettes, compte tenu de leur âge, sont sections clés endommagées et manquantes du texte. L'informaticien Gabriel Stanovski de l'Université hébraïque de Jérusalem et des collègues de différents départements ont collaboré pour utiliser l'intelligence artificielle afin de percer les secrets de ces tables, complétant ainsi le texte cunéiforme manquant.
Qu'est-ce que l'écriture cunéiforme
L'écriture cunéiforme est un système d'écriture utilisé dans l'ancienne Mésopotamie. Elle est considérée comme la forme d’écriture la plus ancienne au monde et est utilisée depuis plus de 3.000 XNUMX ans. L'écriture cunéiforme se compose de petits signes en forme de coin inscrits sur des tablettes d'argile humides.
Encoder les tableaux en écriture cunéiforme
Dans le passé, la recherche a déjà « lu » d'anciens documents (lettres de la renaissanceQu'il s'agisse d'un vin rare et exotique ou du même vin dans différents millésimes, quel que soit votre choix au rouleaux d'herculanum), mais jamais avec ce type d'approche des écrits de la civilisation sumérienne.
L’équipe a utilisé un modèle d’IA d’apprentissage en profondeur déjà formé sur 104 langues différentes. Il s'agit notamment de certaines langues sémitiques comme l'hébreu, qui partage des similitudes avec l'akkadien. Ils ont ensuite entraîné l’algorithme en transcrivant 10.000 XNUMX tablettes cunéiformes. Le modèle d'IA a été capable de suggérer des mots et des phrases contextuellement précis pour combler les lacunes. Prenez-le comme une sorte de T9, mais avec le mésopotamien.
Comment savons-nous que les suggestions sont pertinentes? Les chercheurs ont également testé l'IA sur des parties connues des tablettes, et l'achèvement y était également excellent. L'intelligence artificielle a reconstitué les phrases en écriture cunéiforme avec une précision étonnante de 89 %, allant même jusqu'à élargir les interprétations possibles des textes.
L'importance de connaître les langues
"La principale conclusion de cette étude", explique Stanovsky, "est que l'utilisation d'autres langues a réellement contribué à codifier l'akkadien". En effet, sans pré-entraîner le modèle sur ces 104 langages différents, la précision de lecture des tablettes cunéiformes était inférieure de près de 30 points de pourcentage.
C'est un outil qui, dans les prochaines années, j'en suis sûr, libérera un potentiel énorme pour le déchiffrement de documents historiques importants.
références: arxiv.org/abs/2109.04513