Телеграмм чат группы localizer страница 279

Котятки, а делал ли кто-нибудь что-нибудь самописное или брал готовое для извлечения непереведенных сегментов из PO-файлов? Чтобы в кошку не тащить один и тот же файл и там через фильтр непереведенные сегменты отыскивать.

источник

15:46пожаловаться #5

А

Александр Викторович... in Localizer

posplit из translatetoolkit может подойти: http://docs.translatehouse.org/projects/translate-toolkit/en/latest/commands/posplit.html

источник

15:51пожаловаться #6

А

Александр Викторович... in Localizer

но оригинальный файл будет удаляться, если что

источник

15:51пожаловаться #7

MG

Mike Gorbunov in Localizer

Спасибо

источник

16:43пожаловаться #8

2020 November 11

DP

Davel Poronin in Localizer

Привет! Кто-нибудь тут работает с синтаксисом ICU и при этом использует машинный перевод. Это реально вообще?

источник

23:25пожаловаться #9

2020 November 12

x

xabk in Localizer

Davel Poronin

Привет! Кто-нибудь тут работает с синтаксисом ICU и при этом использует машинный перевод. Это реально вообще?

Я не знаю, существует ли движок, который бы их понимал, особенно без каких-либо требований по упрощению... Не думаю, потому что ICU не настолько распространён, чтобы на него выделять деньги и силы, как мне кажется.

Но если использовать какой-то из непонятливых, то можно перед отправкой на машинный перевод разворачивать строку в отдельные фразы с соответствующими веткам числами, а потом сворачивать обратно.

То есть превращать одну строку "You have {x, plural, =0 {no apples} one={# apple} other={# apples}}" для русского, например, сразу в 5 фраз (сохранять исключения типа =N и добавлять форм по грамматике, помечать айдишники суффиксами N, one, few, ...) и подставлять вместо переменной прям число из нужного диапазона в каких-нибудь понятных движку тегах, к примеру, "You have <icu1>2</icu1> apples" для few. А потом собирать эти переводы в ICU-конструкцию из целых фраз, меняя число в тегах на переменную.

Кажется, это костыль, но в противном случае что-то подобное должно быть внутри движка... Потому что иначе совсем сложно: ведь при работе с ICU часто приходится перекраивать структуру оригинальной фразы (добавлять новые ветки для согласующихся слов или добавлять слова в ветки), и для машины, кажется, проще загонять целые фразы... Да и для человека, если честно, так проще, кроме самых простых случаев с яблоками без прилагательных :)

Чтобы написать такой костыль, вроде бы, все есть... Инфа по грамматике есть, формулы есть, синтаксис описан. Навскидку вижу проблему в случаях, когда в английском, к примеру, "one {one apple}". Тут хз, как автоматически это конвертировать в one {# apple}... Такое, конечно, лучше загонять изначально в =1, а не в one, и можно это даже требовать, но это уже более жёсткие требования к исходном формату получаются.

источник

07:44пожаловаться #10

DP

Davel Poronin in Localizer

xabk

Я не знаю, существует ли движок, который бы их понимал, особенно без каких-либо требований по упрощению... Не думаю, потому что ICU не настолько распространён, чтобы на него выделять деньги и силы, как мне кажется.

Но если использовать какой-то из непонятливых, то можно перед отправкой на машинный перевод разворачивать строку в отдельные фразы с соответствующими веткам числами, а потом сворачивать обратно.

То есть превращать одну строку "You have {x, plural, =0 {no apples} one={# apple} other={# apples}}" для русского, например, сразу в 5 фраз (сохранять исключения типа =N и добавлять форм по грамматике, помечать айдишники суффиксами N, one, few, ...) и подставлять вместо переменной прям число из нужного диапазона в каких-нибудь понятных движку тегах, к примеру, "You have <icu1>2</icu1> apples" для few. А потом собирать эти переводы в ICU-конструкцию из целых фраз, меняя число в тегах на переменную.

Кажется, это костыль, но в противном случае что-то подобное должно быть внутри движка... Потому что иначе совсем сложно: ведь при работе с ICU часто приходится перекраивать структуру оригинальной фразы (добавлять новые ветки для согласующихся слов или добавлять слова в ветки), и для машины, кажется, проще загонять целые фразы... Да и для человека, если честно, так проще, кроме самых простых случаев с яблоками без прилагательных :)

Чтобы написать такой костыль, вроде бы, все есть... Инфа по грамматике есть, формулы есть, синтаксис описан. Навскидку вижу проблему в случаях, когда в английском, к примеру, "one {one apple}". Тут хз, как автоматически это конвертировать в one {# apple}... Такое, конечно, лучше загонять изначально в =1, а не в one, и можно это даже требовать, но это уже более жёсткие требования к исходном формату получаются.

Круто, спасибо за варианты!

источник

11:54пожаловаться #11

DP

Davel Poronin in Localizer

А в играх тоже синтаксис ICU используется или ты просто очень эрудирован? :)

источник

17:43пожаловаться #12

x

xabk in Localizer

Используется. Правда, не так часто, как хотелось бы. Но впервые я его увидел в каком-то софте, не в игре.

Тут у меня пока не используется, но будет :) Вот только в анриал энджин, собака, зачем-то свой синтаксис вместо стандартного... Думаю про конвертер туда-сюда.

источник

18:10пожаловаться #13

AA

Alexander Ashikhin in Localizer

xabk

Используется. Правда, не так часто, как хотелось бы. Но впервые я его увидел в каком-то софте, не в игре.

Тут у меня пока не используется, но будет :) Вот только в анриал энджин, собака, зачем-то свой синтаксис вместо стандартного... Думаю про конвертер туда-сюда.

А где можно почитать нормально про ICU? Можешь поделиться стартер паком?) Я несколько раз натыкался на обсуждение здесь, становилось интересно, но быстрое гугление меня обычно на всякие Краудины отправляет, где они пишут, как они это поддерживают. Тоже периодически задумываюсь о внедрении в отдельные компоненты продукта типа чат-ботов.

источник

18:17пожаловаться #14

AA

Alexander Ashikhin in Localizer

Хорошая цифра

источник

18:18пожаловаться #15

x

xabk in Localizer

На Краудине, кстати, неплохой хелп. Прям отлично для старта. Но сейчас с компа скину несколько ссылок, как раз для своих подбирал недавно.

источник

18:19пожаловаться #16

DP

Davel Poronin in Localizer

Alexander Ashikhin

А где можно почитать нормально про ICU? Можешь поделиться стартер паком?) Я несколько раз натыкался на обсуждение здесь, становилось интересно, но быстрое гугление меня обычно на всякие Краудины отправляет, где они пишут, как они это поддерживают. Тоже периодически задумываюсь о внедрении в отдельные компоненты продукта типа чат-ботов.

http://site.icu-project.org/

site.icu-project.org

ICU - International Components for Unicode

ICU Project Site