Перевод — древнее искусство, возможно, столь же старое, как сама цивилизация. Некоторые из старейших сохранившихся человеческих текстов, месопотамские глиняные таблички, содержат списки эквивалентных слов на разных языках.
Однако древние корни не являются препятствием для инноваций, а появление «генеративного» искусственного интеллекта, такого как ChatGPT от OpenAI, привело к резкому росту технологий перевода. Поставщик данных Statista Прогнозирование Мировой рынок перевода на основе искусственного интеллекта (в частности, «обработки естественного языка» или НЛП) вырастет примерно с 5 миллиардов долларов в 2023 году до примерно 12 миллиардов долларов к 2030 году.
Одной из компаний, надеющихся на получение выгоды, является немецкая компания DeepL, которая была названа победителем в категории ИТ и кибербезопасности в опросе FT 2023 Tech Champions. Но у него нет недостатка в конкурентах, среди которых не только другие стартапы, но и технологические гиганты, такие как Google и владелец Facebook Meta, а также компании-разработчики программного обеспечения для бизнеса, включая Cisco и Microsoft.
«Каждый хоть немного в этом участвует», — говорит Марк Пикот, директор по исследованиям Futurum Group, фирмы, занимающейся технологическими исследованиями и консалтингом. «Google был очень заинтересован в этом [language translation] Надолго.»
Огромный объем контента, производимого компаниями и другими организациями, означает, что спрос, вероятно, останется высоким. Сектор перевода «обслуживает каждую отрасль под солнцем, потому что любая отрасль нуждается в языковом переводе», — говорит Флориан Вайс, управляющий директор Slator, компании, которая предоставляет новости и исследования в области языкового перевода.
Достижения в области искусственного интеллекта позволяют сэкономить деньги и время, поскольку переводчики-люди вмешиваются только при необходимости или по указанию высококачественного программного обеспечения для прогнозирования, например, предлагаемого американским стартапом ModelFront. Согласно исследованию, опубликованному в прошлом году исследовательской фирмой Gartner, к 2025 году 25% работы переводчиков-людей будет состоять из рецензирования и редактирования текстов, переведенных машиной.
DeepL быстро росла с момента ее запуска в 2017 году Ярославом Котиловским, польским ученым-компьютерщиком, который также является генеральным директором компании.
Ранее Котиловский был техническим директором компании-предшественника Linguee — многоязычного словаря, составленного посредством компьютерного анализа двуязычных текстов, найденных в Интернете. Он возглавлял команду, которая использовала языковые данные Linguee для создания того, что впоследствии стало DeepL, онлайн-переводчика на основе нейронных сетей (типа системы искусственного интеллекта, смоделированной на человеческом мозге).
Теперь DeepL, как переименовала себя частная компания, предлагает бесплатные и платные услуги ежемесячной подписки, охватывающие около 30 языков. По данным компании, у нее более 20 000 коммерческих клиентов, включая издательскую компанию Elsevier и технологическую компанию Fujitsu.
Хотя компания не раскрывает свои доходы, в январе прошлого года она объявила, что получила от инвесторов оценку в 1 миллиард долларов, что придало ей так называемый статус «единорога».
«DeepL, вероятно, самая успешная технологическая компания в сфере перевода за последние 15 лет», — говорит Вайс.
Основная идея компании заключается в том, что она производит лучшее в мире программное обеспечение для машинного перевода. Это утверждение основано на «слепых тестах», когда профессиональные переводчики выбирают наиболее точный перевод текста, не зная, какая компания его выполнила.
«Все сводится к использованию лучших технологий», — говорит Котиловски. Нейронные сети компании могут анализировать огромные объемы данных, собранных из Интернета, чтобы определить наиболее вероятный перевод любого конкретного предложения.
Но это касается и конкурентов DeepL, которые тоже используют нейронные сети. Когда его спросили о том, что дает DeepL преимущество, представитель компании сказал бы только, что это комбинация «архитектуры» ее нейронных сетей, ее обучающих данных и человеческого вклада, лежащего в основе ее моделей данных.
С тех пор исходные данные Linguee были дополнены другими источниками, такими как веб-сайты компании и социальные сети, что, по словам Котиловского, помогает DeepL освоить более неформальные выражения.
Клиенты DeepL, несомненно, приветствуют более точные переводы. Но сможет ли компания поддерживать свой рост в условиях конкуренции со стороны гораздо более крупных технологических компаний?
Кутыловский кажется равнодушным. Он говорит, что DeepL продолжит концентрироваться на исследованиях «академического уровня» в таких областях, как подключение нейронных сетей для перевода и получение наилучших обучающих данных.
«Мы конкурируем с Google Translate и, следовательно, с Google с момента появления Google Translate. [our] компании, — говорит он. — Для нас ситуация не сильно изменилась».
Однако он признает, что в последнее время темпы перемен ускорились. «В области искусственного интеллекта происходит много разработок, и скорость исследований возросла», — говорит он. «[That] Очевидно, это вызов для наших команд, потому что им нужно немного ускориться.
DeepL недавно начала выходить за пределы своего основного рынка. В январе компания запустила инструмент письма на базе искусственного интеллекта, который «улучшает письменное общение» на английском и немецком языках. Он также стремится выйти за пределы своей европейской базы, особенно в Азии и Соединенных Штатах.
Одним из источников конкуренции является растущий потребительский рынок машинного перевода. «Люди хотят поехать в Европу [on holiday] «У вас в кармане есть переводчик», — говорит Берн Эллиот, вице-президент и эксперт по искусственному интеллекту компании Gartner.
В августе Meta выпустила программное обеспечение для искусственного интеллекта, которое, по ее словам, может автоматически переводить речь и текст примерно со 100 языков. Компания заявила, что технология SeamlessM4T стала шагом на пути к универсальному переводчику — реалистичной версии ушного корпуса. Вавилонская рыба В классической научной фантастике Автостопом по Галактике.
Meta заявила, что сделает общедоступными основные данные SeamlessM4T, включая 470 000 часов речи и текста, чтобы позволить исследователям и разработчикам использовать эту технологию.
Но, несмотря на всю растущую конкуренцию в сфере машинного перевода, DeepL сохраняет оптимизм относительно своего будущего, убежденная, что сосредоточенность на качестве перевода откроет новые возможности.
«Когда вы улучшаете качество перевода… постепенно открывается все больше и больше вариантов использования машинного перевода», — говорит Котиловский.
«Зомби-любитель-евангелист. Неизлечимый создатель. Гордый новатор в твиттере. Любитель еды. Интернетоголик. Жесткий интроверт».
More Stories
Spotify обвиняет Apple в нежелательном изменении технологии регулировки громкости
Первый пациент Neuralink дал имя своему мозговому чипу и выучил новые языки
Meta рассматривает возможность выпуска новых очков смешанной реальности в качестве альтернативы гарнитурам