1017

Поиск смысла в массиве текста

привет, интересует вопрос: дано: 20 000 000 текстовой информации (к примеру, слов), разносмысловой +картинки - .JPG (сканы статей из газет и журналов, книг)надо всё вбить в базу данных, чтоб считывался смысл из этих 20 миллионов слов. предположительно, статьи и книги будет сканировать спец. человек и преобразовывать всё в формат .PDFкак реализовать эту идею - поиск смысла в массиве текста?
0