Добавить новость

Посетителей столичной «Армы» больше 3 часов не выпускали силовики из клуба

Сергунина: в «Москино» представят программу к 83-й годовщине битвы за Москву

В России учреждены премии в области детской литературы

Дорогомиловский суд рассмотрит иски пострадавших от блюд «Кухни на районе»



News in English


Новости сегодня

Новости от TheMoneytizer

AI Explained: The Fine Art of AI Optimization

Major technology companies are racing to shrink their artificial intelligence (AI) systems as mounting computing costs push them to rethink how they build and deploy their most advanced programs. This efficiency drive marks a significant shift in the industry, where the focus is moving from raw power to streamlined performance.

The process, known as AI optimization, involves refining complex software systems to improve their performance while reducing the computing power they need to run. These efficiency improvements can transform challenging economics into sustainable operations for companies that rely on massive computing systems. Meta’s September partnership with Amazon Web Services (AWS) demonstrated this trend, enabling the firm to offer its AI model Llama in various sizes, optimized for different computing environments.

The Server Farm Challenge

Beneath AI’s prowess lies a costly infrastructure. Running advanced programs requires vast data centers and specialized processors. For instance, Microsoft’s partnership with OpenAI required building multiple AI supercomputers, each using thousands of Nvidia A100 GPUs. These installations consume substantial power — training a large language model (LLM) can require energy equivalent to thousands of households.

This pressure has sparked innovation in software architecture. Google has pioneered various optimization techniques, such as quantization, which reduces the precision of numbers required in calculations while maintaining model performance. Meta achieved efficiency gains with its Llama AL models through architectural improvements, allowing smaller models to perform strongly while using fewer parameters.

From Data Center to Pocket Device

The drive for efficiency goes beyond cost control. Apple’s deployment of on-device machine learning for Face ID demonstrates how optimization enables sophisticated software to run on mobile devices. Google’s implementation of on-device translation in Android is another example of how optimized models can operate without constant cloud connectivity.

The results are changing how software is deployed. Qualcomm’s AI Engine, particularly in its Snapdragon series, enables smartphones to run optimized versions of neural networks locally. This technology powers features like real-time translation in Google’s Pixel phones and advanced camera capabilities in recent Android devices.

Cloud providers have also embraced optimization. Microsoft Azure and AWS have introduced specialized instances for running optimized AI workloads, allowing more efficient resource allocation across their data centers. These improvements help manage the growing demand for AI computing resources.

The efficiency trend signals a maturing technology sector, with a shift in focus from capability demonstrations to practical deployment considerations. Nvidia’s introduction of the H100 GPU reflects this industry-wide pivot toward optimization. The chip’s Transformer Engine improves the efficiency of LLM operations by adjusting precision dynamically during processing.

Engineering teams continue to develop new optimization techniques. Google’s work on sparse model training reduces computational needs by focusing on the most important neural connections. Intel’s development of specialized AI accelerators aims to improve efficiency through hardware designed specifically for AI workloads.

The impact extends beyond Silicon Valley. Healthcare providers use optimized machine learning models for medical imaging analysis, allowing sophisticated processing on standard hospital equipment. Financial institutions have implemented machine learning systems that balance analysis with practical computing requirements.

The race to optimize has become as critical as the drive to innovate. Companies that master these techniques gain the ability to deploy more capable services while managing costs. This marks a fundamental change in system design philosophy, pushing the industry beyond the pursuit of raw computing power toward more sustainable and practical solutions.

The post AI Explained: The Fine Art of AI Optimization appeared first on PYMNTS.com.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Экология - дело каждого. ВООП вручил Почётные грамоты представителям «АиФ»

Мэр Москвы пригласил присоединиться к благотворительной акции «Добрая ёлка»

Телеканал "Тула24" вошел в ТОП по числу уникальных посетителей сайта

Сирота из Чувашии уже 10 лет бомжует в Москве: "Меня просто кинули"

Музыкальные новости

Певица Ирина Ортман передала в Одинцове гумпомощь бойцам СВО

«ДедМорозное шоу со Снегурочкой» — новогодний подкаст с персонажами ГК «Рики» в Яндекс Музыке

Смоленские энергетики продолжают работать в усиленном режиме из-за непогоды

Time to Cashmere

Новости России

Ветеринары учат более 500 детей из Подмосковья быть добрыми хозяевами животных

В Подмосковье приговорили к пожизненному основателя наркомагазина "Гидра"

Советская мафия против Голливуда

Губернатор Оренбуржья Паслер рассказал о сессии «Национального здравоохранения-2024»

Экология в России и мире

Как сделать кормушку для птиц своими руками: из чего ее можно сделать. 10 способов

Волшебный поезд с Дедом Морозом порадует гостей и жителей Нижнего Новгорода

Волшебная новогодняя ночь для гостей Marins Park Hotel Нижний Новгород

Дышите глубже: доктор Кутушов рассказал, как "безопасные" альтернативы сигарет отравляют ваш организм

Спорт в России и мире

Хачанов намерен вернуться в топ-10 рейтинга ATP в следующем году

Кузнецова назвала Медведева одним из двух главных скандалистов ATP-тура

Казахстанская теннисистка из топ-30 WTA одержала победу на турнире в России

Кафельников назвал позором допинговые скандалы ведущих теннисистов

Moscow.media

На Волге...

Компания Pango Cars открыла 100-й дилерский центр в России

В ДТП на трассе Москва – Касимов в Рязанской области погибли два человека

Сегодня утром в Новосиле горел жилой дом











Топ новостей на этот час

Rss.plus






Помилование Байденом сына демонстрирует «демократическую лицемерность» - адвокат

«Судьба человека зависит от его поступков»: Станислав Дужников — о важных ролях и семье

Суд арестовал организатора ЛГБТ-туров

Сирота из Чувашии уже 10 лет бомжует в Москве: "Меня просто кинули"