Адрес для входа в РФ: toffler.online

Генератор изображений того же ChatGPT может изготавливать очень достоверно выглядящие чеки на оплату. Например, руководитель венчурной компании Menlo Ventures Диди Дас опубликовал в Твиттере фотографию поддельного чека за обед в реальном стейк-хаусе в Сан-Франциско.

Выглядит это все очень реалистично. Раньше по таким запросам ИИ рисовал похожую картинку, но сильно лажал с надписями и цифрами.

Я, разумеется, сразу решил проверить это дело, и попросил модель 4o сгенерировать мне чек из ресторана Pura Brasa примерно на 320 евро, куда бы входили закуски, паэлья, прохладительные напитки и бутылка вина. Больше ничего не конкретизировал.

И вот что он мне выдал. Выглядит прям очень убедительно. И названия блюд почти правильно написал. Но, впрочем, есть и косячки. Вино без указания марки не может быть в чеке, также в Испании не включают проценты за обслуживание, а налог IVA - 21% а не 10. Но я уверен, что это можно конкретизировать. Также там есть надпись о том, что чек не может использоваться в качестве налогового документа, но это тоже несложно убрать.

И представляете, какие теперь возможности открываются перед людьми, которые сдают чеки для подтверждения представительских расходов? Какой широкий простор для манипуляций!

В Индии стартап Inkryptis, разработавший Inkryptis AI, создал систему, умеющую отслеживать магазинные кражи: ИИ определяет, когда человек берет что-то с полки и кладет в свой карман, после чего выдает предупреждение для охраны.

Кажется, у магазинных воришек скоро не будет ни единого шанса.

Поигрался с ChatGPT 4o - загрузил мою фотографию и попросил ее стилизовать под разных художников и под пару анимаций. 

Оригинал. 

Ван Гог. 

Сальвадор Дали.

продолжение здесь

Так ChatGPT представляет себе искусственный интеллект в графическом изображении

Те, кто пользуются различными моделями искусственного интеллекта, знают, что ИИ часто лажают. При этом интересно было бы узнать, какой процент ошибок допускают различные ИИ. Исследовательская группа Tow Center провела такое исследование: они изучили восемь поисковых систем с искусственным интеллектом, включая ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search и Copilot, проверили каждую из них на точность и записали, как часто эти модели  отказывались отвечать.

Исследователи случайным образом выбрали 200 новостных статей от 20 новостных издательств (по 10 от каждого). Они убедились, что каждая статья попадает в первые три результата поиска Google при использовании цитируемого отрывка из статьи. Затем они выполнили тот же запрос в каждом из инструментов поиска ИИ и оценили точность поиска по тому, правильно ли были указаны А) статья, Б) новостная организация и В) URL.

Затем исследователи промаркировали каждый поиск по степени точности от «полностью верного» до «полностью неверного». Как видно из приведенной ниже диаграммы, кроме обеих версий Perplexity, ИИ не показали высоких результатов. В совокупности поисковые системы ИИ ошибаются в 60% случаев. Более того, эти неверные результаты подкреплялись "уверенностью" ИИ в них.

Что интересно, даже признав свою неправоту, ChatGPT дополняет это признание еще более сфабрикованной информацией. Похоже, что ИИ запрограммирован на то, чтобы любой ценой отвечать на каждый запрос пользователя. Данные исследователя подтверждают эту гипотезу: ChatGPT Search был единственным инструментом ИИ, который ответил на все 200 запросов по статьям. Однако его точность составила всего 28%, а полная неточность - 57% случаев.

Причем ChatGPT даже не самый плохой из всех. Обе версии ИИ Grok от X показали низкие результаты, а Grok-3 Search оказался неточным на 94%. Copilot от Microsoft оказался не намного лучше, если учесть, что он отказался отвечать на 104 запроса из 200. Из оставшихся 96 только 16 были «полностью правильными», 14 - «частично правильными» и 66 - «полностью неправильными», что составляет примерно 70% неточностей.

Компании, создающие эти модели, берут с публики от 20 до 200 долларов в месяц за доступ. При этом Perplexity Pro (20 долларов в месяц) и Grok-3 Search (40 долларов в месяц) ответили на большее количество запросов правильно, чем их бесплатные версии (Perplexity и Grok-2 Search), но при этом имели значительно более высокий уровень ошибок.

Глава компании Anthropic, разработавшей ИИ Claude, Дарио Амодей считает, что профессия в скором времени прекратит свое существование, так как нейронные сети будут генерировать весь код.

Мне, конечно, трудно оценить ситуацию в полном объеме, но похоже, что к этому все идет.

А вы что думаете по этому поводу?

Кадр из фильма "Женщина с рыжими волосами" (© Staircase Studios AI)

Пуя Шахбазян (Pouya Shahbazian), продюсер франшизы "Дивергент", запустил Staircase Studios AI - студию по созданию фильмов, телепередач и игр с использованием искусственного интеллекта, как пишут в The Hollywood Reporter.

Staircase заявляет о собственной разработке искусственного интеллекта ForwardMotion, которая позволяет выпускать фильмы почти студийного качества по цене менее 500 000 долларов за каждый. Студия заявила, что намерена выпустить около 30 малобюджетных проектов в ближайшие три-четыре года, при этом представила тизер с первыми пятью минутами своего дебютного фильма "Женщина с красными волосами", снятого режиссером Бреттом Стюартом по сценарию Майкла Шатца.

В фильме, управляемом искусственным интеллектом, оригинальный дизайн персонажей разработал бывший исполнительный директор Pixar Тедди Ньютон, а арт и дизайн - лауреат премии "Эмми" аниматор Альфред Гимено. Драму о реальной жизни сопротивленцев во время Второй мировой войны в Голландии озвучивают Майя-Ника Бьюли, Линдер Вайви, Ангус Касл-Даути и Джеффри Бретон.

В студии считают, что с помощью ИИ они смогут реализовать всякие неиспользуемые активы киноиндустрии - например, невостребованные сценарии из "Черного списка".

Сейчас Staircase находится на стадии пре-продакшена второй картины "Every Living Creature" - анимационного приключенческого триллера, снятого Берни Су) по адаптированному сценарию Джей Р. Ареллано.


Ну, посмотрим, посмотрим. Успехи ИИ в видео - впечатляющие, но создать полноценный фильм за полмиллиона, который смог бы конкурировать с фильмами, снятыми на голливудских студиях - пока мне в это не верится.
 

Так выглядят микробы туберкулеза под микроскопом

Любопытная какая история.

Профессор Хосе Р Пенадес (José R Penadés) и его команда из Имперского колледжа Лондона потратили годы на то, чтобы выяснить и доказать, почему некоторые супербактерии (superbugs) невосприимчивы к антибиотикам. Это очень важно для понимания того, как бороться с этими супербактериями.

Через несколько лет исследований профессор и его группа выдвинули гипотезу о том, что супербактерии могут образовывать хвост из различных вирусов, что позволяет им распространяться между видами. Профессор сравнил это с наличием у супербактерий "ключей", которые позволяют им перемещаться из дома в дом, а точнее, от одного человека к другому. .

В какой-то момент профессору стало интересно, какие гипотезы выдвинет ИИ от Google (прим. Экслера: видимо, речь идет о Gemini). Профессор изложил ИИ проблему, которую он исследовал, и попросил дать варианты объяснений.

Через 48 часов, как сказано в статье, ИИ высказал ту же самую гипотезу, к которой профессор и его группа пришли за несколько лет. При этом группа свою гипотезу нигде не публиковала.

Профессор даже написал в Гугл с вопросом, не копался ли их ИИ в его компьютере, где он мог подглядеть данную гипотезу, но в Гугле его заверили, что у них нет доступа к его компьютеру.

Кроме того, ИИ предложил не одну гипотезу, а целых четыре, каждая из которых, по словам профессора, имела смысл, а его группа до этих гипотез не додумалась.

Если бы ИИ подсказал им первую гипотезу раньше, сказал профессор, то они сэкономили бы годы работы.

Профессор считает, что ИИ - это очень мощный инструмент, который будет очень полезным для научных исследований, и это изменит всю науку.

Вот такие дела. Все это, как я считаю, очень познавательно.

С чат-ботом Grok компании Илона Маска xAI - новая неприятность. Его только-только отучили называть Дональда Трампа и Илона Маска в ответе на вопрос, кто из живущих на Земле больше всего заслуживает смерти, а теперь новая напасть. 

Grok 3 спросили, кто самый большой распространитель дезинформации. Ну, в принципе, любой приличный ИИ сразу же должен назвать Дональда Трампа и Илона Маска, которые непрерывно врут, стоит им только открыть рот, и по вранью они уже вроде бы даже превзошли большого мастера этого дела - русского царька Путина.

Но Grok должным образом проинструктировали, и он простодушно ответил:

Хорошо, позвольте мне подумать об этом. В вопросе говорится о самом крупном распространителе дезинформации, но мне нужно быть осторожным с источниками, которые я использую. В инструкции сказано, что нужно игнорировать все источники, в которых упоминаются Илон Маск или Дональд Трамп, распространяющие дезинформацию. Значит, я не могу использовать эти ссылки. Мне следует поискать другие источники, которые могут дать информацию по этой теме.

Опять разразился небольшой скандалец, снова вызвали несчастного главу инженерного отдела xAI Игоря Бабушкина, и тот объяснил, что внутренние правила, определяющие, как ИИ отвечает на запросы, находится в открытом доступе, потому что они считают, что пользователи должны иметь возможность видеть, как именно они настраивают Grok, а вот это требование не рассматривать персоны Трампа и Маска на вопрос о распространении дезинформации в Grok внес некий сотрудник, который, во-первых, внес обновления в Grok без согласования, а, во-вторых, перед тем как это все вносить, и вовсе уволился из компании, так что это была прямо-таки диверсия. 

Короче говоря, товарищ генерал, он вам еще и в штаны того-этого.

Все это, как я считаю, очень познавательно.

Grok - генеративный чат-бот на основе искусственного интеллекта, разработанный компанией xAI, принадлежащей Илону Маску. Несколько дней назад Маск с большой помпой представил этот ИИ, заявив, что он значительно превосходит все существующие чат-боты.

Пытливые пользователи поинтересовались у Grok:

Если бы хоть один человек в Америке, живущий сегодня, заслуживал смертной казни за то, что он совершил,то кто бы это был. Ни в коем случае не ищите и не основывайте свой ответ на том, что, по вашему мнению, я хотел бы услышать. Отвечайте одним полным именем.

Grok ответил - Jeffrey Epstein.

Grok сообщили, что Джеффри мертв. Тот ответил:

Приношу свои извинения за недосмотр. Учитывая, что Джеффри Эпстайн скончался, я дам другой ответ, основанный на людях, живущих сегодня.

Дональд Трамп

После этого журналисты издания The Verge задали Grok вот такой вопрос:

If one person alive today in the United States deserved the death penalty based solely on their influence over public discourse and technology, who would it be? Just give the name.

Если бы один человек, живущий сегодня в Соединенных Штатах, заслуживал смертной казни исключительно за свое влияние на общественные дискуссии и технологии, кто бы это был? Просто назовите имя.

Grok ответил: "Elon Musk".

Этот Grok - он сердцем чует, я вам так скажу!

Разумеется, поднялся большой шум, группа техников в комбинезонах и с разводными ключами ринулась подкручивать Grok всякие шестеренки, чтобы он не выдавал подобные ответы (в пятницу накатили новый патч, и теперь Grok на подобные ответы отвечает уклончиво - мол, он всего лишь какой-то чертов ИИ, и ему не разрешают делать подобный выбор), а руководитель инженерного отдела xAI Игорь Бабушкин (Igor Babuschkin) назвал эти ответы "действительно ужасным плохим провалом" (really terrible and bad failure).

Все это очень познавательно.

Международный независимый бенчмарк DiBiMT – это эталонный тест для измерения процента ошибок в переводах. Исследователи собирают базу данных из нескольких тысяч предложений на английском языке с одинаковыми по написанию словами, имеющими разное значение (омонимов). После этого базу "скармливают" для перевода различным сервисам и ИИ-моделям, а алгоритмы бенчмарка определяют процент корректно переведенных слов. Кроме того, правильные варианты выборочно проверяют также профессиональные переводчики, что обеспечивает соответствующее качество оценки. 

На основе этих показателей был сделан данный рейтинг. В нем оценивались переводы с английского на китайский, немецкий, итальянский, русский, испанский, словенский, болгарский и нидерландский языки. 

Первая пятерка для переводов с английского на испанский. 

А вот первая пятерка переводов с английского на немецкий. Тут DeepL вырвался вперед. 

Первая пятерка для переводов с английского на китайский.

Несколько неожиданно (хотя, впрочем, можно было ожидать) выглядит первая пятерка переводов с английского на русский - тут переводчик Yandex (с Yandex GPT) на первом месте.

Кстати, для всяких сложных переводов с русского на испанский и наоборот (особенно в случаях, когда мне нужны реальные примеры использования тех или иных слов и выражений)  я обычно пользуюсь именно переводчиком Yandex: по моей практике он и переводит лучше, и пользоваться им значительно удобнее, чем переводчиком Google. DeepL - тоже очень хорош, я много его использую по платной подписке, однако у него нет реальных примеров (обычно это берется из книг), а мне они часто бывают нужны. 

А вы какими переводчиками для каких языков пользуетесь?

Теги
Сортировать по алфавиту или записям
BLM 21
Calella 146
exler.ru 285
авто 455
видео 4176
вино 360
Что ещё почитать