Array
(
    [SRC] => 
    [WIDTH] => 0
    [HEIGHT] => 0
)

Бизнес

Бизнес-кейс. Как стартап для правильного написания на узбекском стал партнером Microsoft
1450

17.10.2023

Бизнес-кейс. Как стартап для правильного написания на узбекском стал партнером Microsoft

Задуманный когда-то как студенческий проект, стартап Tahrirchi сегодня создает первое в мире решение для проверки узбекского текста на грамматические ошибки. Мы поговорили с основателями об истории развития технологического решения.


Мухаммадсаид Мамасаидов, 23 года, город — Ташкент, основатель Tahrirchi, tahrirchi.uz

IMG_0991.JPG

Как все началось

Я окончил университет Инха в Ташкенте. Во время учебы нам нужно было придумать идею для группового проекта. Я создал Spell Сhecker — систему проверки правописания для узбекского языка. Мы сдали проект, но программа не работала как нужно. Я не смог с этим свыкнуться и углубился в изучение проблемы. Так оказался на форуме финских ученых: их язык по структуре похож на узбекский. И я принял решение создать свой стартап.

Последние два года занимаюсь созданием программы для проверки текста на узбекском языке — Tahrirchi.

У меня нет профессионального предпринимательского образования. Я изучал литературу о стартапах: читал, как создавать проекты, делать MVP и другие подобные вещи.

О проекте

Tahrirchi — это программа, которая помогает правильно писать на узбекском. С ростом популярности родного языка все больше спрос на решения, которые облегчают изучение и помогают людям не допускать ошибок.

На первом этапе мы проверяли орфографию — это интересный и необычный процесс. Теперь мы создаем решение, которое сможет проверить текст на грамматические и стилистические ошибки на уровне журналиста-первокурсника. Все это с помощью искусственного интеллекта. И это не ChatGPT.

Цель Tahrirchi — оцифровать узбекский язык и восполнить технические пробелы, допущенные в связи с нехваткой исследовательской мощи в компьютерной лингвистике. В нашей стране эта сфера начала развитие недавно и в будущем будет только расти, ведь узбекский — второй по популярности тюркский язык в мире после турецкого.

Уровень грамотности населения не становится лучше. А учитывая разные диалекты, у одного слова появляются несколько неправильных форм. Мы решаем эту проблему.

В проекте три участника. Все мы работаем удаленно.

О получении инвестиций

У меня было несколько попыток получить финансирование для проекта, но они не оказались успешными. Однажды я увидел новость о конкурсе mGovAward 2022 и решил поучаствовать.

Вместе с однокурсниками собрали команду и за два месяца сделали мобильную клавиатуру. Я не ожидал победы, но судьям и общественности проект пришелся по душе.

IMG_0857 (1).JPG

Полученное вознаграждение — 50 000 долларов, мы направили на развитие проекта, сделали веб-сайт и разные расширения.

Самой затратной стала исследовательская составляющая проекта: сбор разных книг, их оцифровка, создание корпуса узбекского языка, штат из лингвистов, тренировка моделей. В итоге нам удалось собрать 35 000 книг из открытых источников и объединить их цифровые копии в один корпус. Это нужно, чтобы условная «Алиса» могла хорошо говорить на узбекском языке. Чем больше данных, тем точнее будут ИИ-модели.

О сотрудничестве с Microsoft

В начале этого года мы поставили цель: расширить досягаемость продукта через создание разных расширений и плагинов. Первым в очереди был Microsoft Word. После небольшого исследования мы приступили к разработке.

Для того чтобы ваше расширение опубликовали, необходимо иметь юридическое лицо. После недолгой проверки вы станете партнером Microsoft и получите возможность публиковать свои плагины в их магазине.

Чтобы ваше расширение опубликовали, необходимо иметь юридическое лицо

После публикации расширение проходит проверку на наличие ошибок, проблем с безопасностью и другие технические вопросы. Этот процесс занял у нас три недели, после чего наше расширение опубликовали.

Позже мы выпустили плагин для браузеров, который работает на любом сайте. Чтобы воспользоваться, достаточно иметь поле ввода.

О планах

У нас на подходе запуск первой в истории модели, которая проверяет узбекский текст на грамматические ошибки. Такое решение реализовано для несколько крупных языков мира, и я рад, что узбекский станет одним из них.

IMG_0518.JPG

В процессе разработки мы советовались с экспертами из таких компаний, как Grammarly и Meta. Итогом стала модель, которая поможет людям, изучающим узбекский язык.

Меню

Люди WE

Профессионалы

Город 24

Возможности

Наши в мире