344,290 грузинских слов и их рейтинги

 

Имею базу грузинских слов, собранную мной из грузинских сайтов и разного рода грузиноязычной литературы. Она содержит 344,290 слов. Я создал малый сапайдер, который ходил по .ge домейнам, находил грузинский текст, брил его и слова сохранял в обозначенной базе. Если слово встречалось повторно, к его рейтингу добавлялось одно очко. Например, слово «фото» встретилось 3339 раз, и соответственно его рейтинг равен 3339-и.

База нуждается в очистке. Она содержит много ошибок, но исходя из рейтингов, легко можно найти слова, в которых возможны ошибки.

В итоге, хочу предложить собранные мною слова. Использование базы для некоммерческих целей бесплатно. Желающих  же использовать базу в коммерческих целях, прошу связяться, и уверен, о деталях договоримся.

Без моего согласия распространение базы незаконно, свяжитесь со мной и в подобном случае.Если найдется добрый человек и очистит базу, прошу связаться.

Базу можно списать со следующей ссылки:
http://koko.ge/wordpress/wp-content/uploads/word_clean.sql 

 
 
ITDC выделяется иновационными проектами и добросовестным отношением к делу

Ия Горгишели
Национальная библиотека парламента Грузии