UProLa

Неокріпші думки

Про мову

with 15 comments

Мова є проблемою. Вірніше, сучасне різнобарв’я мов є проблемою. Люди думали, що machine translation цю проблему знівелює, але все сталось не як гадалось…

Як варіант вирішення, можна заставити всіх людей перейти на спілкування одною нейтральною мовою, Esperanto. В цьому випадку жоден machine translator не знадобиться. Варіант хороший, але тільки в теорії, бо люди щось до нього не тяжіють.

Я пропоную симбіоз MT і створення нової мови. Придумуємо діалект мови (української, наприклад) – правила граматики, слова та звуки таким чином, щоб обрана мова стала регулярною. Менше різних винятків, більш строга орфографія. Виконання МТ для такої мови буде на порядок простішою задачею, а отже буде доступним ріалтайм автопереклад голосу. А вивчення буде простішим, саме через високу схожість з рідною мовою.

Звісно, ця мова потрібна не для художньої літератури, а щоб можна було швидко зкомунікуватись з іноземцем по важливому питанню – переговори юридичних осіб, обмін наукових знань, орієнтування у незнайомій країні, листування.

Written by danbst

Травень 7, 2012 at 17:30

Оприлюднено в Програмування

Відповідей: 15

Subscribe to comments with RSS.

  1. Я чекати опис граматика.

    bunyk

    Травень 7, 2012 at 19:28

    • неправильно, повинно бути “я чекаю опис граматики”

      danbst

      Травень 7, 2012 at 19:34

      • На есперанто було б “я чекас описо граматикон“.

        bunyk

        Травень 7, 2012 at 20:13

      • взагалі-то парсинг граматики української мови не є невирішуваною задачею. І під “більш регулярною” я не мав на увазі “максимально регулярною”. Я прагну зменшити кількість винятків та двозмістовностей.

        Візьмемо, для прикладу, перший абзац посту.

        “Мова є проблемою. Вірніше, сучасне різнобарв’я мов є проблемою. Люди думали, що machine translation цю проблему знівелює, але все сталось не як гадалось…”

        Перекладемо його гуглоперекладачем на англійську

        “It is a problem. Rather, the modern diversity of languages ​​is a problem. People thought that machine translation problem znivelyuye, but not done as it should have happened …”

        Бачимо деякі проблеми мови:
        1. МТ вирішив, що перше речення є мовним оборотом типу “Мова йде про …”, хоча я цього не мав на увазі. У новому діалекті не повинно бути обороту “мова йде про …”, тоді не буде казусів
        2. слово “знівелює” занадто рідкісне і тому не повинно використовуватись, натомість краще перебудувати речення (або використати синонім “знищить”)
        3. частина “все сталось не як гадалось” може бути спрощена до “цього не сталось”
        4. слово “вірніше” не повинно використовуватись. Натомість, потрібно казати більш конкретний варіант думки – “точніше”

        Після цих замін автопереклад не складає проблем

        “The language is a problem. More precisely, the modern diversity of languages ​​is a problem. People thought that machine translation eliminate this problem, but this did not happen …”

        danbst

        Травень 7, 2012 at 20:40

      • А чому граматика має бути вона? Взагалі, роди в мовах — це щось ірраціональне. Наприклад, у французькій «сонце», «книжка» і «зима» — чоловічого роду, «місто»— жіночого. Якого дідька я маю це все запам’ятовувати?!
        Потім ще є наголоси, які в українській також падають куди завгодно і в деяких випадках змінюють зміст.
        Крім того, проблема синонімії і неоднозначностей навряд чи вирішується так просто. Якщо брати одну мову за еталон, то еталонними стануть саме її неоднозначності, а якщо робити нову мову, то без чіткого формального опису мови (рожева мрія лінгвістів, яку вони чортзна-скільки намагаються здійснити) вона стане просто сумішшю неоднозначностей із інших. По-моєму, присутність синонімій, неоднозначностей, багатозначностей — це невід’ємна ознака природної мови.
        Крім того, справді хотілось би більше конкретних деталей, ніж загальних слів.

        dmytrish

        Травень 8, 2012 at 08:26

        • >>>Крім того, справді хотілось би більше конкретних деталей, ніж загальних слів.
          мені також =) якби я був лінгвістом, то спробував би погуглити на цю тему, але поки-що можу тільки висловити ідею.

          danbst

          Травень 8, 2012 at 13:37

  2. По моєму між “translation” і “elimitate” пропущено “should”.🙂

    А взагалі, суть ясна. Ти хочеш зробити щось на зразок Simple english, тільки формальніше.

    bunyk

    Травень 7, 2012 at 20:58

    • > По моєму між “translation” і “elimitate” пропущено “should”.
      ага. перевіривши кілька синонімічних варіантів, слово “усуне” переклалося правильно. Проте з цією синонімією треба щось робити, бо кожен раз підбирати підходяче слово важко…

      danbst

      Травень 7, 2012 at 21:43

  3. Ты, конечно, знатный изобретатель велосипеда, но мне думается, что лингвистика и филология развиваются неким естественным, природным способом. Что-то вроде естественного отбора. Английский язык сначала больше по политическим, а теперь уже, скорее природно стал стандартом. Есть даже варианты basic/simple english (даже у Вики). Эсперанто умерло не родившись и жалкая кучка последователей этого искусственного языка скорее кичатся тем, что они такие особенные. Лингвистический андерграунд.

    Дальше, английская грамматика проста и понятна, в отличие, например, от русского языка, и если разбираться в сложностях грамматики то лучше копать не в сторону популяризации чего-то нового, а в сторону улучшения алгоритмов, которые есть сейчас.

    Александр Щапов

    Травень 8, 2012 at 09:26

  4. Да, ещё. Не то, чтобы я противник андерграунда, просто ты ведь говоришь о масштабах планеты, правильно? Вот там то и решает мейнстрим.

    Александр Щапов

    Травень 8, 2012 at 09:28

    • Хм. Про маштаби планети. Я мав на увазі групу людей, яким важливо спілкуватись з іноземцями, а це не всі люди планети.

      Англійська граматика можливо і проста, але англійська мова СКЛАДНА.

      Ті алгоритми, що зараз, вони не покращаться, доки не буде створено AI. Щоб його передчасно не створювати, достатньо перестати вкладати двозмістовність у слова.

      Природній добір? Вивчення англійської замість діалекту української? Ні, думаю легше буде діалект вивчити, ніж мову з чужим алфавітом.

      danbst

      Травень 8, 2012 at 13:30

  5. Є ще одне, радикальне, рішення цієї проблеми — Kill all humans!!

    dmytrish

    Травень 8, 2012 at 10:37

    • Маєш пропозиції як це зробити? Бо у мене всі варіанти впираються у ліміт грошів та часу.

      danbst

      Травень 8, 2012 at 13:23


Залишити відповідь

Заповніть поля нижче або авторизуйтесь клікнувши по іконці

Лого WordPress.com

Ви коментуєте, використовуючи свій обліковий запис WordPress.com. Log Out / Змінити )

Twitter picture

Ви коментуєте, використовуючи свій обліковий запис Twitter. Log Out / Змінити )

Facebook photo

Ви коментуєте, використовуючи свій обліковий запис Facebook. Log Out / Змінити )

Google+ photo

Ви коментуєте, використовуючи свій обліковий запис Google+. Log Out / Змінити )

З’єднання з %s

%d блогерам подобається це: