Un modèle d'intelligence artificielle (IA) d'apprentissage en profondeur peut prédire les mots, fragments et phrases manquants à partir de tablettes cunéiformes qui ont jusqu'à 4500 XNUMX ans.
Les tablettes d'argile gravées de texte cunéiforme en langue akkadienne sont des outils clés pour comprendre les cultures qui existaient en Mésopotamie (plus ou moins la région de l'actuel Irak) entre 2500 avant JC et 100 après JC. Beaucoup de ces tablettes datent de l'âge, sont endommagés et manquent de sections clés du texte Gabriel Stanovski L'Université hébraïque de Jérusalem et des collègues de différents départements ont collaboré pour utiliser l'intelligence artificielle et percer les secrets de ces plaques, complétant le texte cunéiforme manquant.
Qu'est-ce que l'écriture cunéiforme
L'écriture cunéiforme est un système d'écriture utilisé dans l'ancienne Mésopotamie. Il est considéré comme la plus ancienne forme d'écriture au monde et est utilisé depuis plus de 3.000 XNUMX ans. L'écriture cunéiforme est composée de petits signes en forme de coin qui ont été inscrits sur des tablettes d'argile humides.

Encoder les tableaux en écriture cunéiforme
Dans le passé, la recherche a déjà « lu » d'anciens documents (lettres de la renaissanceou rouleaux d'herculanum), mais jamais avec ce type d'approche des écrits de la civilisation sumérienne.
L'équipe a utilisé un modèle d'IA d'apprentissage en profondeur déjà formé dans 104 langues différentes. Il s'agit notamment de certaines langues sémitiques telles que l'hébreu, qui partage des similitudes avec l'akkadien. Ils ont ensuite formé l'algorithme en transcrivant 10.000 XNUMX tablettes en écriture cunéiforme. Le modèle d'IA a pu suggérer des mots et des phrases contextuellement précis pour combler les lacunes. Prenez-le comme une sorte de T9, mais avec le mésopotamien.
Comment savons-nous que les suggestions sont pertinentes? Les chercheurs ont également testé l'IA sur des parties connues des tablettes, et l'achèvement y était également excellent. L'intelligence artificielle a reconstitué les phrases en écriture cunéiforme avec une précision étonnante de 89 %, allant même jusqu'à élargir les interprétations possibles des textes.

L'importance de connaître les langues
"La principale conclusion de cette étude", explique Stanovsky, "est que l'utilisation d'autres langues a vraiment aidé à coder l'akkadien". En effet, sans pré-formation du modèle sur ces 104 langues différentes, la précision de lecture des tablettes cunéiformes était inférieure de près de 30 points de pourcentage.
C'est un outil qui, dans les prochaines années, j'en suis sûr, libérera un potentiel énorme pour le déchiffrement de documents historiques importants.
références: arxiv.org/abs/2109.04513