Задуманный когда-то как студенческий проект, стартап Tahrirchi сегодня создает первое в мире решение для проверки узбекского текста на грамматические ошибки. Мы поговорили с основателями об истории развития технологического решения.
Мухаммадсаид Мамасаидов, 23 года, город — Ташкент, основатель Tahrirchi, tahrirchi.uz
Как все началось
Я окончил университет Инха в Ташкенте. Во время учебы нам нужно было придумать идею для группового проекта. Я создал Spell Сhecker — систему проверки правописания для узбекского языка. Мы сдали проект, но программа не работала как нужно. Я не смог с этим свыкнуться и углубился в изучение проблемы. Так оказался на форуме финских ученых: их язык по структуре похож на узбекский. И я принял решение создать свой стартап.
Последние два года занимаюсь созданием программы для проверки текста на узбекском языке — Tahrirchi.
У меня нет профессионального предпринимательского образования. Я изучал литературу о стартапах: читал, как создавать проекты, делать MVP и другие подобные вещи.
О проекте
Tahrirchi — это программа, которая помогает правильно писать на узбекском. С ростом популярности родного языка все больше спрос на решения, которые облегчают изучение и помогают людям не допускать ошибок.
На первом этапе мы проверяли орфографию — это интересный и необычный процесс. Теперь мы создаем решение, которое сможет проверить текст на грамматические и стилистические ошибки на уровне журналиста-первокурсника. Все это с помощью искусственного интеллекта. И это не ChatGPT.
Цель Tahrirchi — оцифровать узбекский язык и восполнить технические пробелы, допущенные в связи с нехваткой исследовательской мощи в компьютерной лингвистике. В нашей стране эта сфера начала развитие недавно и в будущем будет только расти, ведь узбекский — второй по популярности тюркский язык в мире после турецкого.
Уровень грамотности населения не становится лучше. А учитывая разные диалекты, у одного слова появляются несколько неправильных форм. Мы решаем эту проблему.
В проекте три участника. Все мы работаем удаленно.
О получении инвестиций
У меня было несколько попыток получить финансирование для проекта, но они не оказались успешными. Однажды я увидел новость о конкурсе mGovAward 2022 и решил поучаствовать.
Вместе с однокурсниками собрали команду и за два месяца сделали мобильную клавиатуру. Я не ожидал победы, но судьям и общественности проект пришелся по душе.
Полученное вознаграждение — 50 000 долларов, мы направили на развитие проекта, сделали веб-сайт и разные расширения.
Самой затратной стала исследовательская составляющая проекта: сбор разных книг, их оцифровка, создание корпуса узбекского языка, штат из лингвистов, тренировка моделей. В итоге нам удалось собрать 35 000 книг из открытых источников и объединить их цифровые копии в один корпус. Это нужно, чтобы условная «Алиса» могла хорошо говорить на узбекском языке. Чем больше данных, тем точнее будут ИИ-модели.
О сотрудничестве с Microsoft
В начале этого года мы поставили цель: расширить досягаемость продукта через создание разных расширений и плагинов. Первым в очереди был Microsoft Word. После небольшого исследования мы приступили к разработке.
Для того чтобы ваше расширение опубликовали, необходимо иметь юридическое лицо. После недолгой проверки вы станете партнером Microsoft и получите возможность публиковать свои плагины в их магазине.
Чтобы ваше расширение опубликовали, необходимо иметь юридическое лицо
После публикации расширение проходит проверку на наличие ошибок, проблем с безопасностью и другие технические вопросы. Этот процесс занял у нас три недели, после чего наше расширение опубликовали.
Позже мы выпустили плагин для браузеров, который работает на любом сайте. Чтобы воспользоваться, достаточно иметь поле ввода.
О планах
У нас на подходе запуск первой в истории модели, которая проверяет узбекский текст на грамматические ошибки. Такое решение реализовано для несколько крупных языков мира, и я рад, что узбекский станет одним из них.
В процессе разработки мы советовались с экспертами из таких компаний, как Grammarly и Meta. Итогом стала модель, которая поможет людям, изучающим узбекский язык.