Локализация. Часть 1: Утилизация
May. 3rd, 2008 11:51 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Все написанное ниже является моим личным пессимистичным :) взглядом на происходящее в индустрии.
Примерно раз в декаду локализация метко стреляет себе в голову. Первый раз это произошло примерно 10 лет назад, когда компьютерные системы утилизации существующих переводов (которые Translation Memory) неконтролируемо вырвались на оперативный простор. В самих системах ничего плохого не было: они массово и без особого шума разрабатывались локализационными фирмами для внутреннего потребления: идея о том, что компьютеры увеличат производительность и качество, лежала на поверхности. Одиночный переводчик - существо ненадежное. Даже идеальный переводчик (а такие есть в природе) иногда дают сбой: где-то устал, где-то глаз замылился... Теория говорит, что надежная система из таких ненадежных элементов может быть построена следующим образом (возьмем для примера англо-русскую локализацию):
Операция 1. Перевод: процесс замены английского текста на русский. Самая дорогостоящая операция. Выполняется, ясен пень, переводчиками.
Операция 2. Редактирование: процесс сравнения английского оригинала и перевода (с исправлением). По цене - где-то процентов 60% от стоимости перевода (скорость значительно выше). Выполняется типа квалифицированными переводчиками/лингвистами.
Операция 3. Вычитка: процесс чтения перевода без обращения к оригиналу. По цене - 30-40% от стоимости перевода. Выполняется редакторами-филологами. (Я в Германии видел совершенно уже монстров, занимавшихся этим несколько десятилетий. Они принципиально отказывались вычитывать текст с экрана компьютера, требовали распечаток. Делали пометки на полях и с негодованием возвращали. Но зато качество было настоящим. Немецким!)
Так переводили десятилетиями.
В середине 90-х локализационные фирмы обнаружили, что стоимость перевода можно существенно снизить, если использовать Translation Memory: часть текста могла быть переведена автоматически (если кто-то уже переводил встретившийся в тексте или аналогичный фрагмент, то его перевод просто вставляется из базы данных), переводчикам за это можно не платить, а с клиента берутся те же деньги...
Дальше, ясен пень, нашлись фирмы, которые начали снижать расценки, чтобы получить больше проектов: можем себе позволить! Заклятые конкуренты спохватились и бросились наперегонки ронять цены: одни, чтобы заполучить новых клиентов, другие, чтобы подманить новых. Фирмы, не использующие Translation Memory, перестали быть конкурентоспособными и вымерли как класс.
Это фактически сгубило индустрию. С одной стороны, клиенты перестали доверять локализационным фирмам: получалось, что локализаторы раньше обдирали клиентов, беря полную стоимость за три операции, а фактически выполняя только две, а то и одну.
С другой стороны, клиенты быстро привыкли к тому, что цены постоянно снижаются, и начали требовать продолжения банкета: у кого цена ниже - тому и проект. А бороться есть за что: годовой локализационный бюджет средних IT-шных фирм - это несколько миллионов долларов, есть, к чему стремиться. Снижаем цену, а там разберемся!
Но для снижения цены ниже определенного предела нужно на чем-то экономить. Сначала экономили на вычитке: фирмы начали вычитывать только часть переводов, либо вообще не вычитывали, подменяя вычитку прогоном программы проверки орфографии. Потом срЕзали редакторов: клиентам начали отправлять текст выданный переводчиками. Другой тенденцией стало снижение зарплат: оклады и расценки в локализации пошли вниз, многие талантливые переводчики поуходили, на их место набирали и набирают студентов. Это - реальность, с которой приходится мириться всем, и клиентам и локализационным фирмам.
Но вот переводы... Их совершенно невозможно читать. Вот реальный пример: документация для одного из моих бывших клиентов, 900 страниц, перевод на русский язык. Прислана одной из крупнейших российских локализационных фирм как окончательный готовый для публикации вариант. Я для интереса прочел 70 страниц. Среднее число слов на странице - примерно 200. Среднее число ошибок (грамматических, синтаксических, стилистических) на каждой странице - 21.
В этом месте замечу, что в индустрии приемлемым считается 1-3 ошибки на тысячу слов.
Я откомментировал каждую ошибку, пнул локализаторов. Через неделю исправленный перевод вернулся. Среднее число ошибок на страницу снизилось до 13.
Откомментировал, пнул, подождал, получил. Прочел. Ладно... Пойдет.
Нанесенный этой вакханалией ущерб оказался больше, чем ожидалось: индустрия не разрушена, но серьезно подбита. Клиенты давят дальше и "киты" локализации в последние пару лет сделали еще два выстрела в ту же голову: одна пуля называется "машинный перевод" ("Machine Translation", aka MT), другая - "халявная локализация" ("community translation").
Об этом - позже.
no subject
Date: 2008-05-04 07:25 am (UTC)no subject
Date: 2008-05-04 09:34 am (UTC)мне по профессиональным соображениям интересно
no subject
Date: 2008-05-04 05:37 pm (UTC)no subject
Date: 2008-05-04 02:26 pm (UTC)Иногда даже 100% и repetitions в TM неготовы оплачивать.
И это типа высшая лига.
хорошая статья, спасибо
no subject
Date: 2008-05-04 03:47 pm (UTC)От переводчиков действительно было бы странно требовать дополнительной вычитки, хотя и такое бывает:). Ее по определению должен делать другой человек, и это уже проблема монстров - искать его.
Но от компаний Lionbridge и Moravia в большинстве случаев все-таки ждут полного цикла TEP.
no subject
Date: 2008-05-04 03:51 pm (UTC)все таки в большинстве случаев в требованиях к проекту цикл ТЕР как раз неполный.
хотя вполне возможно что после нас это идет дальше на Р или Е
но нам об этом не рассказывается)
no subject
Date: 2008-05-04 06:02 pm (UTC)По идее-то...
no subject
Date: 2008-05-04 05:47 pm (UTC)С другой стороны, документацию мало кто читает... Почитали бы - ужаснулись :) Я вот читаю онлайновую документацию (не буду говорить, какой продукт :) ). Самая первая страница, Обзор функций. Первое предложение в двух первых абзацах переведено одинаково. Лезу в английский: предложения разные, отличаются парой ключевых слов (названия функций). А перевод тот же. Translation Memory присобачила готовый перевод (Fuzzy), который никто не проверил. В 2003 году такое стОило фирме Palm 3 миллиона долларов. Сейчас никому дела нет :)
А с третьей... Вот сейчас два месяца все фирмы срочно набирают переводчиков для крупного Майкрософтовского проекта. Принимают вообще кого угодно - лишь бы переводили. Люди не знают ни Традоса ни Логопорта. Люди не в курсе терминологии. И их все равно берут. Вот у меня вопрос: какая вычитка спасет результат? :)
no subject
Date: 2008-05-04 06:02 pm (UTC)По поводу того, что Lionbridge и Moravia не проверяют качество, это не совсем так. Еще как проверяют. Не на 100%, конечно, но немало. По крайней мере на проектах Майкрософт. Но объем идет огромный, и все непроконтролируешь. Да и некому потом исправлять ошибки будет:) Круг их вендоров в России все равно небольшой, качество у всех примерно одинаковое, пул переводчиков тоже почти общий:)
no subject
Date: 2008-05-13 12:43 pm (UTC)no subject
Date: 2008-05-04 05:47 pm (UTC)no subject
Date: 2008-05-04 04:15 pm (UTC)Да, она позволила на определенном этапе сдорово повысить производительность и сократить расходы. Но разве и без нее не нашлось бы желающих отобрать у конкурентов пару проектов, просто предложив неоправданно низкую цену? Мне кажется, это глобальные процессы, которые сейчас характерны для многих отраслей. Почему снижается средний срок службы автомобилей или падает качество принтеров HP? Из-за такой же экономии. Используются более дешевые материалы, производство переносится в страны третьего мира и т. д. И главное, что покупателей это устраивает. И заказчиков переводов тоже.
Cпрос на качественный перевод по прежнему есть, пусть и не очень большой. Но и хороших переводчиков очень немного. И такой хороший переводчик при желании вполне может найти себе достойно оплачиваемую работу. По крайней мере, если говорить о паре английский-русский и об ИТ-тематике.
no subject
Date: 2008-05-04 05:54 pm (UTC)Не столько с развитием, сколько с тем, как этим добром распорядились. По пунктам:
1. Пытались обмануть клиентов(брали за одно, делали другое)
2. Снижали цены - безусловно, чтобы только получить проект. 19 центов за слово много? - Давайте мы тогда будем брать 15 центов. Разумеется, клиенты понимают, что их прсто надувают, и что настоящей цены никто не знает.
3. Технологии не выдерживаются.
4. Набирают на перевод кого попало.
И ведь читы вокруг TM продолжаются. Lionbridge, строго говоря, продолжает брать с клиентов за одно, а переводчикам платить за другое. Logoport позоляет.
> Cпрос на качественный перевод по прежнему есть, пусть и не очень большой.
Об этом я отдельно напишу.
> И такой хороший переводчик при желании вполне может найти себе достойно оплачиваемую работу.
Еще бы... Толковых-то мало. Но результат все равно удручает: ппадаешь в гадюшник, где тебя делают ответственным за все проблемы... Fun, fun, fun...
no subject
Date: 2008-05-04 04:54 pm (UTC)Наверное, процентов 70 материалов, которые сейчас переводятся, при ценах 10-летней давности вообще никто бы не переводил.
Взять ту же Майкрософт. Топовые продукты, типа Windows и Office, переведены весьма достойно. Они приносят деньги, и на их локализацию тоже тратят достаточно средств. А отдача от инвестиций в локализацию каких-нибудь статей для библиотек и MSDN и TechNet минимальна. Потому и качество перевода соответствующее. А 10 лет назад их на русский вообще не переводили.
no subject
Date: 2008-05-04 06:01 pm (UTC)Майкрософт - это исключение. Фирма, которая создала свою собственную сеть локализационных фирм и свой собственный локализационный процесс. Майкрософт при локализации платит трижды:
1. За перевод
2. За техническую экспертизу
3. За незавиимый контроль качества.
Причем, платит top rates. Это - другой мир.
> А отдача от инвестиций в локализацию каких-нибудь статей для библиотек и MSDN и TechNet минимальна
Поэтому в них и вкладываются по другому. Там совсем другой процесс, другие расценки, другие вендоры и машинный перевод.
> А 10 лет назад их на русский вообще не переводили.
10 лет назад в России был финансовый кризис. Почти все фирмы вообще прекратили локализацию: Novell перевел русский в Level 3 и локализация 90% продуктов прекратилась, APC и Lotus/IBM отказались от планов локализации своих продуктов на русский, и т.п. Майкрософт была чуть ли не единственной фирмой, которая сказала: мы будем продолжать локализацию на русский, пусть даже себе в убыток (это я по памяти привожу слова Оли Дегруновой). Ясно, что никаких MSDN-ов не было. но продукты и документацию продолжали переводить.
no subject
Date: 2008-05-04 06:07 pm (UTC)1. За перевод
2. За техническую экспертизу
3. За незавиимый контроль качества.
Есть ощущение, что большая часть этой тройной оплаты все равно оседает в Лайонбридже, а до российских фирм доходит очень немного, не говоря уже о переводчиках:)
no subject
Date: 2008-05-04 06:26 pm (UTC)Да, разумеется, переводчикам достается только доля от перевода. Техническая экспертиза/review (номер два списке) должна проводиться штатными сотрудниками фирмы, имеющими соответствующие сертификаты (да и то... Это в жизни редко делается). Независимый контроль качества (LQS. Номер три) отрабатывается честно, но там - своя сеть лингвистов... И вообще, очень изолированный призрачный мир. Раньше там господствовал Berltz, а теперь там - разброд и шатание...