Новите GPT-4.1 модели на вештачка интелигенција се фокусираат на програмирање

На почетокот на неделата, OpenAI ја претстави новата генерација на своите модели со вештачка интелигенција под името GPT-4.1, која вклучува мини и нано варијанти. Овие модели се особено оптимизирани за задачи поврзани со програмирање и извршување инструкции. Иако не се достапни преку ChatGPT, можно е да се користат преку OpenAI API. Една од нивните клучни карактеристики е можноста за обработка на текст до 750.000 зборови.

Новите модели доаѓаат во време кога конкурентските компании како Google и Anthropic прават дополнителни напори за развој на напредни решенија за автоматско кодирање. Gemini 2.5 Pro на Google и Claude 3.7 Sonnet на Anthropic, како и V3 моделот на DeepSeek, веќе постигнаа забележителни резултати во програмските тестови.

Целта на OpenAI и другите технолошки лидери е да развијат модели кои можат самостојно да решаваат сложени задачи во областа на софтверското инженерство. Во оваа насока се движи и амбицијата да се создаде систем за вештачка интелигенција кој би можел да функционира како независен „софтверски инженер-агент“ способен да создава комплетни апликации, вклучувајќи тестирање, документација и контрола на квалитетот.

OpenAI тврди дека GPT-4.1 е значително подобрен благодарение на повратните информации од корисниците. Фокусот беше на подобра поддршка за програмирање на предниот дел, намалување на непотребните промени, прецизно следење на стандардните формати и посигурна употреба на алатките. Сето ова овозможува развој на поефикасни агенти за вештачка интелигенција за инженерски задачи во реалниот свет.

Според внатрешните податоци на OpenAI, GPT-4.1 ги надминува претходните модели како GPT-4o и неговите варијации во повеќето тестови за програмери. Мини и нано верзиите на новиот модел носат поголема брзина и помала потрошувачка на ресурси, но со малку помала прецизност. GPT-4.1 nano е исто така најприфатливиот модел во нивната понуда.

Цените за користење на моделот зависат од количината на обработка: GPT-4.1 чини 2 долари за милион влезни токени и 8 долари за милион излезни токени, додека цените за мини и нано верзиите се значително пониски.

На SWE-bench Verified тестот, GPT-4.1 постигна резултати меѓу 52% и 54,6%, малку пониски од конкурентите Google и Anthropic, чии модели надминуваат 60%. Разликата делумно произлегува од техничките ограничувања на платформата на која беа извршени тестовите.

Покрај тоа, моделот беше тестиран и во задачи за разбирање видео содржини, каде што покажа исклучителни резултати - особено во категоријата долги видеа без преводи.

И покрај неговите подобрувања, GPT-4.1 споделува некои ограничувања на другите напредни модели. Сè уште може да прави грешки во задачите со кои лесно би се справиле искусни професионалци, како што е откривање или поправање на безбедносни пропусти во кодот. Исто така, неговата прецизност паѓа при обработка на големи количини на токени - од 84% на 8.000 токени на 50% на 1 милион токени. OpenAI признава дека моделот може да биде премногу буквален, честопати бара многу конкретни и прецизно формулирани прашања.

Тагови
реклама

Какви промени носи младата Месечина во Стрелец?

Read more

Двајца млади скопјани најдени починати

Read more

Денешниот датум 12.12 е еден од најмоќните во годината – направете неколку симболични чекори за да ве следи среќа

Read more

„Протече“ стратегијата на Трамп: Кои земји сака да ги одвои од ЕУ?

Read more

Софтвер

Android добива мноштво нови функции за пристапност

Read more

Instagram воведува ограничување од три хаштагови по објава

Read more

OpenAI тестира групен разговор за ChatGPT

Read more

Mozilla додава AI Window во Firefox за разговор со AI асистент

Read more
 

Гик

Научници открија скриена моќ на мозокот за согорување на масти

Читај повеќе

Видови морски ежови на работ на истребување поради морска пандемија

Читај повеќе

Како бил расцепкан Луксембург за денес да биде една од најмалите држави во Европа?

Читај повеќе

Battlefield 6 воведува ажурирање за Winter Offensive и бесплатно борбено оружје

Читај повеќе

Зошто некои коцки мраз се кристално бистри, а други заматени и бели?

Читај повеќе

Дали би седеле 100 дена во изолација за 23.000 евра?

Читај повеќе

Зошто Google и Apple ги здружија силите?

Читај повеќе

Windows конечно доби корисно ажурирање

Читај повеќе
  • filter

70 години од усвојувањето на знамето на ЕУ: Како едноставниот дизајн стана глобален симбол на надеж?

Читај повеќе