Добавить новость

Сербия отказалась вводить санкции против России

В Москве прошло заседание Евразийского межправительственного совета

Эксперт Щельцин предупредил о мошеннических схемах в новогодние праздники

Воскресенские спортсмены отлично выступили на Всероссийских соревнованиях по Восточному боевому единоборству



Новости сегодня

Новости от TheMoneytizer

Apache Flink: Flink Table API & SQL

Привет! Меня зовут Александр Булатов, я старший инженер данных в Блоке Данных билайна. В этой серии статей я расскажу, как выглядит создание Source и Sink для Table API & SQL и как Table API взаимодействует с DataStream API.

Я работаю на проекте Radcom, в котором мы получаем данные о детализации звонков. И есть источник потоковых данных, которые мы получаем с Kafka. Таких потоков у нас внутри Radcom одиннадцать штук, и данные от них идут в формате csv. Формат не самый удобный для обработки, потому что он не имеет в себе схему — нам присылают просто голые строки csv, без какой-либо схемы, и нам нужно парсить эти строки относительно ее. 

В одном подобном потоке вполне может находиться сто миллиардов записей в сутки, а это со всех потоков почти семь терабайт в день. У нас в билайне это считается одним из самых больших потоков, которому требуется очень много ресурсов, в год с учетом репликации мы занимаем почти семь петабайт данных. 

Так вот, мы принимаем данные в csv и должны их сохранять в Hive в колоночных форматах, чтобы впоследствии аналитики и Data Scientists могли пользоваться этими данными. У нас принято использовать либо ORC, либо Parquet. Мы попробовали оба формата, пришли к Parquet. 

Читать далее

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Циркулирующее предложение: ключевая метрика криптовалютного рынка

Облачность и снег ожидаются в Москве 14 декабря

Появилось видео аварии с фурой на Новорижском шоссе

Фестиваль «Путешествие в Рождество» стартует в Москве 14 декабря

Музыкальные новости

«Динамо» расстаётся с канадским лидером. Где теперь окажется Эрик О’Делл?

Вяльбе, Исинбаева и Поздняков не вошли в новый состав исполкома ОКР

Станции метро "Зенит" и "Беговая" закрывали на вход в Петербурге

В Яндекс Картах появились городские зимние развлечения Самары

Новости России

Всемирный день катания на коньках отметят на ВДНХ

Вучич: США введут санкции против NIS из-за российской собственности

Фестиваль «Путешествие в Рождество» стартует в Москве 14 декабря

Появилось видео аварии с фурой на Новорижском шоссе

Экология в России и мире

Зимний фестиваль «Усадьбы Москвы»

Международный конкурс искусства «Сокровища нации» 2024

Missoni, коллекция pre-fall 2025

Международный конкурс искусства «Сокровища нации» 2024

Спорт в России и мире

Надаль приедет на молодежный итоговый в Джидду

Соболенко выиграла награду WTA за продвижение женского тенниса

WTA назвала белоруску Соболенко лучшей теннисисткой года

Раскрыта неожиданная причина превосходства молодой теннисистки над Еленой Рыбакиной

Moscow.media

Утвержден обвинительный акт в отношении жителя Санкт-Петербурга обвиняемого в контрабанде в Литовскую Республику культурных ценностей – черепа вымершего животного

TODAY 50% DISCOUNT ON ALL https://boosty.to/ivanw

Весенний Торжок 2

Котельная в Малоархангельском районе появилась пока только на бумаге











Топ новостей на этот час

Rss.plus






В Москве прошло заседание Евразийского межправительственного совета

В Подмосковье задержали водителя, который высадил из автобуса маленького ребенка

Газзаев прокомментировал игру «Спартака» Станковича

Апелляционная инстанция подтвердила штраф Ивлеевой в 50 тыс. рублей за дискредитацию ВС России