Определение тематики текста является достаточно простой задачей (так, например, Яндекс.Новости определяет сюжеты новостей по совпадению ключевых слов). В то же время жанр текста, характеристики его автора (например, пол, возраст) не зависят прямо от ключевых слов, поскольку текст в одном и том же жанре или одного и того же автора может быть написан на разные темы. В лекции рассматриваются подходы к автоматическому определению этих характеристик.