Требуется специалист с
хорошими знаниями в области Data
Mining. Плюсом будет владение любым из обозначенных языков
(shell, perl, java, ruby, python, R).
Дано: Есть массив словоформ, и набор
соответствующих им метрик. Необходимо
построить классификаторы и произвести
кластеризацию.
Ретроспектива - предыдущие исследования проведены при помощи weka (понимание инструмента не обязательно).
Ближайшим аналогом задачи может являться кластеризация словоформ для
контекстной рекламы, там в зависимости от набора метрик фразы ее относят
к тому или иному блоку (сразу уточняем, реальная задача не про
это).
Проект долгосрочный, состоит из ряда этапов . На первом, по нашем оценкам, потребуется около 20 ч.
Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.
Почти 40 пар поучаствовали в турнире по конкуру на Кубок Гагарина в Щелкове
Кинопродюсер.
МОК не допустил до Олимпиады сильнейших борцов и тхэквондистов из России
Театр и Цирк, Культура и Концерт, Россия и Дети: «Волшебный платок бабушки Дари» - это захватывающее путешествие в мир бурятской сказки, которое не оставит равнодушным ни одного зрителя