traduction assistée par ordinateur

Les textes d’Aozora étant disponibles directement sous forme numérique et lisibles sur un navigateur, les dictionnaires en ligne comme rikai-chan facilitaient déjà la lecture des kanjis (il y a souvent des kanji “à l’ancienne” dans les textes d’avant 1945).

Ensuite sont apparus des outils comme deepL ou google translate qui permettaient d’avoir rapidement une traduction très approximative, mais c’est surtout la facilité d’accès, depuis 2024, à des outils d’IA performants de type large language models qui a changé les conditions de traduction.

Tout se passe comme si les outils comme Google Translate traduisent phrase par phrase, sans “comprendre” le sens, tandis qu’un LLM gère la cohérence de l’ensemble du texte qu’il traduit. En conséquence, une traduction par LLM demande beaucoup moins de réécriture.

les différents outils IA utilisés

Gemini Deepseek Perplexity Qwen

Sans faire d’inventaire préalable de tous les outils disponibles, j’ai essayé, en mode non payant, quelques uns des outils IA généralistes les plus connus : Gemini (alphabet), ChatGPT, Deepseek, Mistral AI, Claude (Anthropic), Perplexity, Qwen (alibaba).

Je me suis ensuite limité à ceux qui m’ont paru les plus efficaces: Gemini, Deepseek, et plus récemment Perplexity, et plus récemment encore Qwen.

ChatGPT ne fait pas de grosses erreurs, mais a tendance à broder, rajouter des nuances, etc.

Il semble que Perplexity, basé en partie sur ChatGPT (il fait appel aussi à Claude et à Mistral), n’a pas ce défaut. En plus de la traduction, il fait de la recherche sur le web à propos du texte à traduire et il cite les principales sources qu’il a trouvées, parmi lesquelles parfois le texte d’Aozora lui-même.

Gemini est plus fidèle au texte que ChatGPT, mais le résultat est plutôt mot-à-mot. Gemini répond rapidement, on peut donc produire assez vite une première version d’un texte, bien qu’il lui arrive de ne pas bien analyser certaines constructions “à tiroir”.

Deepseek est aussi fiable, n’invente pas, et donne un résultat littérairement plus travaillé que Gemini. Il a l’avantage de commenter ses choix de traduction et de style, et il paraît rechercher à quel genre de littérature se rattache le texte à traduire. Parfois, quand il pense en avoir trouvé l’auteur, il se trompe mais pas tant que ça: il prend du Sakaguchi pour du Dazai (deux écrivains assez proches), ou du Shimaki dans sa période prolétarienne pour du Kobayashi Takiji, écrivain typique de la littérature prolétarienne. Mais Deepseek a deux défauts: il n’est pas toujours accessible (ses serveurs sont peut-être saturés), et il refuse de traduire certains textes, quand il les considère trop violents (par exemple des passages de textes de Yumeno de la veine “ero-guro”) ou trop politiques (les conflits sino-japonais sont parfois en arrière-plan dans les textes de 1930-1940).

Qwen3, de Alibaba Cloud, est aussi efficace que Deepseek, et a l'avantage d'être plus accessible. C'est ce modèle, plutôt que Deepseek, que j'utilise actuellement, en concurrence avec Gemini. Qwen est beaucoup plus lent que Gemini et fait plus souvent des erreurs de compréhension du texte, mais produit un texte plus "liitéraire", moins mot-à-mot.

De manière générale, il est préférable d'utiliser au moins deux LLM pour traduire un texte.