Недавно вышло обновление популярного интерфейса Automatic1111 для графической нейросети Stable Diffusion. Теперь же мы специально ищем новости нейросетей, чтобы узнать, насколько удалось продвинуться исследователям ИИ. Журнал Popular Mechanics разобрался в вопросе. Когда нейросети станут умнее человека и почему этого стоит бояться. Pixverse AI — это нейронная сеть, разработанная компанией Pixverse, которая используется для создания цифрового контента.
15 удивительных вещей, которые научились делать нейросети
В исследовательской работе , в которой подробно описываются диффузионные трансформеры DiT , объясняется, что это новая архитектура для диффузионных моделей, которая заменяет широко используемую магистраль U-Net трансформером, работающим на скрытых участках изображения. Применение DiT позволяет более эффективно использовать вычислительные мощности и превосходить другие подходы к диффузной генерации изображений. Еще одна важная инновация, которой пользуется Stable Diffusion 3. В исследовательской работе по сопоставлению потоков объясняется, что это новый метод обучения нейросетей с помощью «непрерывных нормализующих потоков» Conditional Flow Matching — CNF для моделирования сложных распределений данных. По мнению исследователей, использование CFM с оптимальными путями транспортировки приводит к более быстрому обучению, более эффективному отбору образцов и повышению производительности по сравнению с диффузионными путями. Улучшенная типографика в Stable Diffusion 3. Как пояснил Мостак, качественная генерация текстов на изображения стала возможной благодаря использованию диффузионной модели-трансформера и дополнительных кодировщиков текста. С помощью Stable Diffusion 3. Хотя Stable Diffusion 3.
В последние месяцы Stability AI также создаст нейросети для создания 3D-изображений и видео. Компания утверждает, что Sora «может создавать реалистичные и фантазийные сцены по текстовым инструкциям». Источник изображения: OpenAI Sora способна создавать «сложные сцены с несколькими персонажами, определенными типами движения и точной детализацией объекта и фона», говорится в блоге OpenAI. Компания также отмечает, что нейросеть может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции». Модель может генерировать видео на основе неподвижного изображения, заполнять недостающие кадры в существующем видео или расширять его. Среди демонстрационных роликов, созданных с помощью Sora и показанных в блоге OpenAI, сцена Калифорнии времен золотой лихорадки, видео, снятое как будто изнутри токийского поезда, и другие. Многие из них имеют некоторые артефакты, указывающие на работу искусственного интеллекта. Например, подозрительно движущийся пол в видеоролике о музее.
Сама OpenAI говорит, что модель «может испытывать трудности с точным моделированием физики сложной сцены», но в целом результаты довольно впечатляющие. Пару лет назад именно генераторы текста в изображение, такие как Midjourney, лучше всего демонстрировали способности ИИ превращать слова в изображения. Но в последнее время генеративное видео стало улучшаться заметными темпами: такие компании, как Runway и Pika, продемонстрировали впечатляющие модели преобразования текста в видео, а Lumiere от Google , похоже, станет одним из главных конкурентов OpenAI в этой области. Как и Sora, Lumiere предоставляет пользователям инструменты для преобразования текста в видео, а также позволяет создавать видео из неподвижного изображения. В настоящее время Sora доступна только отдельным тестировщикам, которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также предлагает доступ по запросу отдельным художникам, дизайнерам и кинематографистам, чтобы получить обратную связь. Компания отмечает, что существующая модель может неточно имитировать физику сложной сцены и неправильно интерпретировать некоторые случаи причинно-следственных связей. Ранее в этом месяце OpenAI объявила, что добавляет маркировку в свой инструмент преобразования текста в изображение DALL-E 3, но отмечает, что их можно легко удалить.
Как и в случае с другими продуктами на базе ИИ, компании OpenAI придется бороться с последствиями того, что поддельные фотореалистичные видео, созданные ИИ, будут выдавать за настоящие. Больше видео, сгенерированных Sora, можно найти здесь. Сегодня была представлена большая языковая модель Gemini 1. Google ясно дала понять, что хочет использовать Gemini в качестве бизнес-инструмента, персонального помощника и не только. В Gemini 1. Модель Gemini 1. При создании новой модели используется набирающий популярность подход «смесь экспертов» Mixture of Experts — MoE , который подразумевает, что при отправке запроса запускается только часть общей модели, а не вся. Такой подход должен сделать модель более быстрой для пользователя и более эффективной для Google.
Но в Gemini 1. Новая версия нейросети имеет огромное контекстное окно, что означает, что она может обрабатывать гораздо более объёмные запросы и просматривать гораздо больше информации одновременно. Ещё он добавил, что исследователи Google тестируют контекстное окно на 10 миллионов токенов — это, например, вся серия «Игры престолов» в одном запросе. В качестве примера Пичаи говорит, что в это контекстное окно можно вместить всю трилогию «Властелин колец». Это кажется слишком специфичным, но, возможно, кто-то в Google проверит, не обнаружит ли Gemini ошибок в преемственности, пытается разобраться в сложной родословной Средиземья. Или ИИ, возможно, сможет понять Тома Бомбадила. Пичаи также считает, что увеличенное контекстное окно будет очень полезно для бизнеса. Глава Google представляет себе, что кинематографисты могут загрузить весь свой фильм и спросить у Gemini, что скажут рецензенты, а компании смогут использовать Gemini для обработки массы финансовых документов.
Пока что Gemini 1. Со временем она заменит Gemini 1. Чтобы получить миллион, придется доплатить. Google также тестирует безопасность и этические границы модели, особенно в отношении нового увеличенного контекстного окна. Сейчас Google находится в бешеной гонке за создание лучшего инструмента ИИ, в то время как компании по всему миру пытаются определить свою собственную стратегию ИИ и сотрудничать с OpenAI, Google или кем-то ещё.
Набор данных был предоставлен ученым правительством страны. Исследователи использовали эти данные для создания длинных шаблонов повторяющихся жизненных событий. Модель использует информацию, полученную в результате наблюдения за миллионами последовательностей жизненных событий. ChatGPT прошел тест по теории разума и показал уровень 9-летнего ребенка Теория разума — это способность понимать психические состояния других. По сути, это форма самосознания, отражающая наше умение понимать, почему мысли и чувства других людей могут отличаться от наших собственных. У нейросети невероятное чутье к языку, которое может создать впечатление, что она разумна — но она просто нашла и воспроизвела существующие языковые схемы, уточняют авторы. Нейросеть также «открыла» третий закон движения планет Кеплера и приблизилась к релятивистскому времени Эйнштейна время замедляется для быстро движущихся объектов. В основе лежит концепция символической регрессии, которая находит уравнения, соответствующие данным. Наиболее важной отличительной чертой нового алгоритма, который назвали «Декарт», является способность логически рассуждать. Если есть несколько уравнений, которые хорошо соответствуют данным, система определит, какие лучше всего согласуются с базовой научной теорией. Способность рассуждать отличает систему от программ «генеративного ИИ», таких как ChatGPT, чья модель имеет ограниченные логические навыки и иногда искажает базовую математику. Логики языковым нейросетям добавили также и ученые Массачусетского технологического института, чтобы уменьшить расизм, сексизм и несправедливость алгоритмов. Мозг в чипе смог решать уравнения и понимать речь Ученые под руководством инженера Фэн Го из Университета Индианы в Блумингтоне США совместили ткань человеческого мозга с электроникой и поставили перед получившимся устройством задачи: распознавание речи и предсказание нелинейных уравнений.
Из этих примеров следует, что на ChatGPT, как, впрочем, и на любую другую нейросеть, нельзя полагаться полностью. Но почему же нейросеть галлюцинирует? В «Яндексе» называют две причины. Первая заключается в самом принципе работы: модель, лежащая в основе ChatGPT, «читает» последовательность слов и предсказывать на её основе следующее.
Впрочем, это не освобождает человечество от ответственности: ИИ все равно может выйти из-под контроля — просто сейчас у него нет мотивации. Мы не можем измерить или как-то засечь, что та или иная система обрела сознание, но искусственному интеллекту не нужны эмоции, чтобы представлять опасность для человека. Например, беспилотный автомобиль может оказаться в ситуации, когда ИИ придется сделать выбор между безопасностью экипажа и жизнью человека, который неожиданно выбежал на проезжую часть. Медицинский ИИ, помогающий в создании вакцин, может в какой-то момент понять, что высокая заболеваемость приводит к мутациям патогенов — и это осложняет дальнейшую разработку препаратов. Почему бы не решить проблему мутаций, снизив потенциальное число пациентов заведомо смертельной вакциной? Можем ли мы предотвратить сингулярность Маловероятно. Мы никогда не сможем избавить искусственный интеллект от непредсказуемых угроз. Мы не сможем предсказать непредвиденные побочные эффекты, потому что люди, в отличие от ИИ, не имеют супер-интеллекта. Если сингулярность все же наступит, то человечество вряд ли сможет остановить дальнейшие развитие ИИ. Однако ученые со всего света не отчаиваются и надеются извлечь из искусственного интеллекта максимум пользы.
Нейросеть: последние новости и статьи
Айтишник разработал нейросеть, которая ищет настроенных на секс девушек. Раздел форума "Новости о нейросетях" предназначен для обсуждения последних событий и достижений в мире нейронных сетей. Будь в курсе последних новостей из мира гаджетов и технологий. Нижегородские учёные определили, что в импульсной нейронной сети, решающей последовательно несколько. Fox News: нейросети смогли создать ИИ-инструменты без помощи человека. Недавно вышло обновление популярного интерфейса Automatic1111 для графической нейросети Stable Diffusion.
НЕЙРО АЛЬМАНАХ
нейросети – последние новости | Айтишник разработал нейросеть, которая ищет настроенных на секс девушек. |
15 удивительных вещей, которые научились делать нейросети - Лайфхакер | В интерфейсе AI Studio нейросеть сейчас доступна с ограничением в 20 запросов в день. |
Новости нейросетей: последние события и тенденции в мире искусственного интеллекта - Chat AI | Эта серия о том, как генеративные модели приучают нас всё делать по-новому: искать в интернете то, чего до нас никто не искал, решать математические задачи з. |
Почему ChatGPT генерирует небылицы? «Яндекс» рассказал про галлюцинации нейросетей | Телеграм-каналы про нейросети – это источники информации, предоставляющие новости, статьи, обзоры и обучающие материалы о нейронных сетях, машинном обучении. |
Please wait while your request is being verified...
Чем на самом деле болеет Кейт Миддлтон Состояние здоровья Кейт Миддлтон, принцессы Уэльской и супруги наследника британского престола принца Уэльского Уильяма, остается одной из самых горячих тем — и не только в Великобритании. Поклонники королевской семьи с тревогой следят за ситуацией, о которой сейчас ходит много слухов и домыслов.
Я бы умножил в несколько раз, если бы искал сам. Определенно это дает возможность фокуса на другие вещи, когда не хватает времени», - сказал выпускник РГГУ Александр Жадан.
К настоящему моменту чат-бот общается с людьми только текстом. Работа с ответом в виде изображения пока тестируется. А еще искусственный интеллект по просьбе пользователя научился генерировать бизнес-идеи и давать советы.
Нейросеть по заданию пользователя выбрала сферу продажи экологически чистых продуктов, «попросила» другую нейросеть придумать оформление для сайта и посоветовала размещать на сайте рекламу. Так мужчина сходу заработал почти 8 тысяч долларов. Нейросеть также способна создавать классические игры, такие как змейка, и писать коды для создания сайтов.
Даже руководство компании-разработчика не знает до конца пределов возможностей своего продукта.
Разработчики языковых моделей ищут новые методы обучения LLM, которые смогли бы уменьшить объём необходимых тренировочных данных и снизить трудоёмкость их разметки. Например, обучают модели на синтетических данных , созданных другой нейросетью. Нейросети учатся искать актуальную информацию в интернете и обращаться к внешним сервисам. Чаще всего для этого используют систему плагинов, по аналогии с решением, используемым в ChatGPT. Компании увеличивают длину контекстного окна для повышения точности ответов. GPT-4 и Claude 100K способны воспринимать более 100 тысяч токенов за раз.
На подходе технологии с ещё более внушительными параметрами — до 1—2 миллионов токенов. Инженеры работают над уменьшением числа галлюцинаций и токсичного вывода в моделях. Нейросети учатся понимать промпты на локальных языках и отвечать на них. Сегодня существующие модели охватывают лишь сотню языков из более чем 7000 известных. В 2023 году для формирования набора данных для 1100 неохваченных ранее языков запущен проект Massively Multilingual Speech MMS. IT-гиганты повышают секретность в отношении своих проприетарных моделей. Теперь отчёты о выходе новых версий нейросетей больше похожи на рекламные брошюры с описанием возможностей, а не на техническую документацию.
Китай становится альтернативным центром развития генеративного ИИ, способным бросить вызов американским компаниям. К 2023 году в этой стране разработали более 130 LLM. Читайте также: Стремительный тигр, мудрый дракон: проекты и перспективы Китая в гонке генеративного ИИ Чего ждать в 2024 году Лидеры IT-индустрии продолжат скрывать подробности о внутреннем устройстве и параметрах обучения своих моделей. Связано это с тем, что именно они, а не только внушительный размер LLM, теперь являются конкурентными преимуществами. Самое ожидаемое событие 2024 года — выход языковой модели следующего поколения от компании OpenAI. Ходят слухи, что GPT-5 сможет достичь уровня AGI по ряду ключевых показателей, что может привести к непредсказуемым последствиям для отрасли ИИ и всего человечества. Читайте также: Новый уровень искусственного интеллекта: что такое AGI, когда он появится и каким будет В любом случае нейросети следующего года станут более эффективными, то есть будут работать лучше при тех же или даже меньших размерах.
Они смогут за один проход понимать тексты, сопоставимые по объёму с романами Льва Толстого, на лету считывать новости из интернета, решать сложные задачи за счёт обращения к внешним сервисам и быстро учиться на актуальных данных, в том числе синтезированных. Мы ждём от них умения общаться с пользователями на их родных языках, включая редкие местные наречия. И конечно, будем следить за нейросетями из Китая, эффективность и качество работы которых продолжат расти, догоняя лучшие западные аналоги. При этом LLM ближайшего будущего, скорее всего, будут более стабильны, безопасны и, возможно, скучны. Они не станут генерировать бред и обсуждать скользкие темы. А взлом с помощью джейлбрейк-промптов постепенно станет невозможным. Виктор Носко генеральный директор компании «Аватар Машина», создатель чат-бота-психолога « Сабина Ai », соавтор проекта FractalGPT — Думаю, что в больших языковых моделях в мировом масштабе наступила эпоха стагнации: теперь новые эмерджентные свойства не будут возникать с ростом числа параметров.
А совершенствование свойств, которые уже проявились, замедлится. При этом новая нейросеть от Google — Gemini, анонсированная с помпой как конкурент GPT-4, не показала существенного превосходства над ней и не оправдала ожиданий пользователей. Ситуацию подпортил и их фейл с пиаром в виде смонтированного демонстрационного ролика. До сих пор российские учёные отставали от зарубежных примерно на один год по мощности моделей и на два года по уровню научных исследований. Однако в 2024-м этот разрыв может сократиться: главным драйвером здесь может стать Fusion Brain от «Сбера», развивающий идею MoE для мультимодальных решений и VisualQA. Ещё одним драйвером может стать разработка собственной модификации архитектуры «трансформер» — особенно если учесть, что за рубежом даже небольшие компании разрабатывают модификации моделей с механизмом внимания attention model.
Чтиво чтивом, а полотно должно быть эстетичным. Если мы опубликуем предложенную Вами информацию, мы придадим ей визуальное решение, созвучное нашему онлайн-изданию и обязательно уведомим Вас об этом, а также укажем Вас, как источник.
"Техно": новости нейросетей
Читайте последние новости на тему в ленте новостей на сайте РИА Новости. Новости. All. news. Десяток забавных и полезных применений нейронных сетей для обработки фотографий, видеороликов, управления беспилотными автомобилями, поиска новых лекарств и просто фана.
#нейросети
ChatGPT уже активно вошла в жизнь людей – к нейросети многие обращаются за советом, она успешно сдает экзамены на юриста или медика. Главные новости к утру 2 апреля. Телеграм-каналы про нейросети – это источники информации, предоставляющие новости, статьи, обзоры и обучающие материалы о нейронных сетях, машинном обучении.
#Нейросеть
Контент, созданный нейронными сетями, может быть не всегда точным и соответствующим ожиданиям маркетолога. В любом случае, нейронные сети — это революционная технология, которая меняет способ, которым мы создаем контент. Мы не можем сказать, что она заменит человеческий творческий потенциал, но она может помочь нам сэкономить значительное количество времени и усилий, затрачиваемых на создание контента вручную. Давайте обсудим эту тему более подробно и узнаем, что вы думаете об использовании нейронных сетей для генерации текстов. Какие будут возможности и риски этого подхода? Каковы ваши личные опыты в этой области?
Вячеслав Борисов, владелец продукта "Сфера. Данная сеть может повышать качество и разрешение видео", — говорит эксперт. Многие опрошенные эксперты отмечают, что индустрия нейросетей в России развивается стремительно. Бизнес давно обратил внимание на искусственный интеллект и применяет его в разных областях: чат—боты, голосовые помощники, сервисы, системы модерации контента на сайтах и маркетплейсах. Даже камеры слежения и системы безопасности, а также системы безопасного управления транспортом.
Фактически ИИ сейчас вшит везде и всюду малозаметно для обычного потребителя, незнакомого с техническими тонкостями. На остальные страны приходится статистическая погрешность от объёма инвестиций этих технологических лидеров", — подчёркивает он. Вячеслав Борисов подтверждает, что, по мнению некоторых, Россия является одним из лидеров в области нейросетей в мире. Традиционно в России сильна математическая школа, необходимая для создания и развития подобных технологий, и, если копнуть глубже, мы обнаружим достаточно много совместных проектов научных институтов и российских компаний по созданию и прикладному использованию ИИ", — поясняет он. Бизнес заинтересован в инвестициях в это направление, поскольку такие технологии приносят очевидную пользу, в том числе финансовую, продолжает Борисов. Наличие инвестиций — гарант того, что мы сможем быть достаточно конкурентоспособны на мировом рынке.
С момента запуска в феврале 2024 года чат-бота GigaChat во «Вконтакте», количество активных пользователей увеличилось в 10 раз и достигло 1,7 млн человек. Что думаешь? Подписывайтесь на «Газету.
Альтман, вместе с Microsoft, придерживается идеи быстрого развития и прихода к AGI с получением прибыли от захвата рынка, а Илья в недавнем выступлении TED предостерегает от таких действий. Рынок труда испытывает недостаток в ML специалистах, как на медународном уровне, так и на российском. Основные области работы ML инженера это или создания собственных моделей искусственного интеллекта, например в Яндексе и Сбербанке, или до-настройка существующих моделей под требования бизнеса. В обеих сферах сейчас большой недостаток специалистов. Иван Крутько Экс-директор по цифровому развитию, «Комус», действующий топ-менеджер федеральной компании, а также бизнес-практик в B2B продажах и цифровой трансформации 2023 год был охвачен нейросетями. Кажется, не произошло ничего более значимого за целый год в мире IT. Но сохранится ли этот спрос в 2024 году? Какое будущее у нейросетей? За последние 20-30 лет мы несколько раз пережили смену технологической парадигмы: персональные компьютеры и интернет, смартфоны и приложения, данные и искусственный интеллект, ML модели и нейросети. Сейчас мы находимся в цикле доминирования нейросетей, ML моделей и АI. В трендах технологического развития 2023 год многое поменял. Нейросети открыли новые возможности перед человеком и бизнесом в области практических решений и монетизации. Объем данных достиг достаточного уровня, чтобы появился масштаб, возросла бизнес-ценность практических кейсов, и это выстрелило. Спрос [на ML-инженеров] вырос, а уровень квалификации снизился, так как российские специалисты с высокими компетенциями ушли на международный рынок. Рост спроса на ML-инженеров в России приводит к тому, что компании готовят специалистов со студенческой скамьи, квотируя ресурсы на стадии поступления будущих специалистов в ВУЗы. Их доход начинается на уровне 300 тыс. Ниже доход у тех, кто является бывшим аналитиком или только недавно переучился. Спрос, однозначно, растет. Есть 2 источника пополнения ML-инженеров: бывшие аналитики данных и студенты. В B2B прогресс заметен в отрасли агрокультуре. В других бизнесах много специфики и отсутствует универсальная экспертиза B2B, поэтому здесь точно сложился дефицит специалистов, и нет готовых решений у интеграторов и цифровых экосистем. Евгения Дёмина Аккаунт-директор IT Test Отбор кандидатов с помощью нейросетей — именно так выглядит рынок аутстафа сегодня. Цифровизация и тренд на нейронные сети вносят свои изменения в сложившийся алгоритм работы в аутстаффинге. Если раньше данные обрабатывались вручную, то сейчас уже никого не удивишь тем, что прогоняешь резюме через нейросети, чтобы те сравнили информацию о кандидате с текстом вакансии. Наивно полагать, что, если напишешь «я опытный senior», то все навыки считаются по умолчанию: бездушная машина моментально откинет вашу кандидатуру. Конечно, рекрутеры не полностью отказываются от просмотра резюме и портфолио, но тем не менее нужно держать в голове, что информация о вас может до HR-специалистов и не дойти. Позиции лидов и руководителей подразделений особенно сложно закрывать. И особенно в сфере разработки и тестирования. Любопытно, что вместе с тем заказчики предоставляют аутстаферам больше свободы. В IT Test нередки случаи, когда аутстаф-сотрудники приходят в команду заказчика на временное усиление, и, опираясь на свою экспертизу, предлагают нестандартные решения. Важно не стесняться проговаривать то, что можно улучшить, не бояться индивидуальных решений. Увеличение размера моделей и числа параметров привело к совершенно фантастическому результату — нейросеть оказалась способна решать задачи, которые ранее были под силу исключительно человеку. Ответы на вопросы, написание текстов, программирование и даже создание музыки — все оказалось в сфере компетенций нейросетей. Благодаря этому внезапно оказалось, что можно почти мгновенно и без квалификации достаточно лишь правильно написать подсказки для нейросети создавать то, для чего раньше требовались время, ресурсы и деньги. Однозначно, сохранится. Кривая Гартнера для новых технологий гласит, что технология будет расти до предела популярности, чтобы далее испытать резкое снижение интереса и выход на плато эффективного использования. В настоящий момент рынок наблюдает исключительно положительные результаты от использования нейросетей: повышение эффективности, снижение издержек, цифровизацию. Чтобы интерес стал снижаться, должна накопиться «критическая масса» негативных сценариев, когда применение нейросетей оказалось неэффективным или вообще неудачным. Однако такие кейсы на рынке сейчас отсутствуют, соответственно, в 2024 году интерес будет лишь расти. В течение длительного времени этот рынок испытывает нехватку квалифицированных специалистов, в особенности уровня senior. Поэтому можно сказать, что спрос на такие кадры остался на прежнем, очень высоком уровне. На ИТ-рынке весь год прошел под знаком роста зарплат, и интерес к нейросетям и ML только усилил данную тенденцию.
Телеграм-каналы про нейросети
AI News — новости сгенерированые нейросетью | В Сети стала доступна для широкого круга пользователей новая нейросеть BratGPT, которую уже называют злым «близнецом» ChatGPT. |
"Техно": новости нейросетей – Москва 24, 30.03.2023 | В России создали нейросеть, которая определит устойчивость мошенникам по фото. |
Орудие или оружие: почему нейросети уже не остановить и чем это грозит человечеству | Самые свежие новости и события в мире нейросетей. Узнайте о последних разработках, технологических трендах и применении искусственного интеллекта. |
Искусственный интеллект - новости и статьи | Rusbase | Нижегородские учёные определили, что в импульсной нейронной сети, решающей последовательно несколько. |
Притвориться человеком: какую опасность может нести нейросеть GPT
- Новости про нейросети -
- Искусственный интеллект / ИТ Новости
- Новости по тегу Нейросети |
- Каким будет будущее нейросетей в 2024 году
- Нейросеть: последние новости и статьи
Телеграм-каналы про нейросети
AI News — новости сгенерированые нейросетью | Российские нейросети уже вполне могут составить конкуренцию нашумевшим ChatGPT и Midjourney. |
Каким будет будущее нейросетей в 2024 году | Сегодня нейросети умеют читать по губам, водить автомобили, придумывать лица несуществующих людей и даже превращать пару мазков в полноценные картины. |
Каким будет будущее нейросетей в 2024 году | Пишем новости о настоящем и будущем в сфере искусственного интеллекта. |
Нейросети: IT, ChatGPT, ИИ
Читайте также: Новый уровень искусственного интеллекта: что такое AGI, когда он появится и каким будет В любом случае нейросети следующего года станут более эффективными, то есть будут работать лучше при тех же или даже меньших размерах. Они смогут за один проход понимать тексты, сопоставимые по объёму с романами Льва Толстого, на лету считывать новости из интернета, решать сложные задачи за счёт обращения к внешним сервисам и быстро учиться на актуальных данных, в том числе синтезированных. Мы ждём от них умения общаться с пользователями на их родных языках, включая редкие местные наречия. И конечно, будем следить за нейросетями из Китая, эффективность и качество работы которых продолжат расти, догоняя лучшие западные аналоги. При этом LLM ближайшего будущего, скорее всего, будут более стабильны, безопасны и, возможно, скучны. Они не станут генерировать бред и обсуждать скользкие темы. А взлом с помощью джейлбрейк-промптов постепенно станет невозможным. Виктор Носко генеральный директор компании «Аватар Машина», создатель чат-бота-психолога « Сабина Ai », соавтор проекта FractalGPT — Думаю, что в больших языковых моделях в мировом масштабе наступила эпоха стагнации: теперь новые эмерджентные свойства не будут возникать с ростом числа параметров. А совершенствование свойств, которые уже проявились, замедлится. При этом новая нейросеть от Google — Gemini, анонсированная с помпой как конкурент GPT-4, не показала существенного превосходства над ней и не оправдала ожиданий пользователей. Ситуацию подпортил и их фейл с пиаром в виде смонтированного демонстрационного ролика.
До сих пор российские учёные отставали от зарубежных примерно на один год по мощности моделей и на два года по уровню научных исследований. Однако в 2024-м этот разрыв может сократиться: главным драйвером здесь может стать Fusion Brain от «Сбера», развивающий идею MoE для мультимодальных решений и VisualQA. Ещё одним драйвером может стать разработка собственной модификации архитектуры «трансформер» — особенно если учесть, что за рубежом даже небольшие компании разрабатывают модификации моделей с механизмом внимания attention model. Роман Душкин генеральный директор ООО «А-Я эксперт» , компании — разработчика систем искусственного интеллекта — LLM продолжат развиваться в сторону мультимодальных моделей и роста числа параметров. Но всё это лишь количественные показатели. Да, они будут расти. Но приведёт ли этот тренд к качественным прорывам? Я сомневаюсь. Моё мнение: большие языковые модели — это бездумные «обезьянки», которые просто достают из «мешков со словами» каждое следующее слово. Они по своей сути такими и останутся, что бы мы с ними ни делали.
Используемая сегодня архитектура нейросетей просто не позволит им совершить качественный скачок. Поэтому стоит ожидать концентрации усилий разработчиков на создании когнитивных архитектур, которые называют BICA biologically inspired cognitive architectures. Здесь могут появиться очень интересные решения. Такие модели способны конвергировать с архитектурами, основанными на других принципах. Сейчас есть все предпосылки для развития в этом направлении. Развитие опенсорсных моделей и демократизация ИИ Что случилось за год Параллельно с закрытыми проприетарными моделями развились нейросети с открытым исходным кодом. Если в 2022 году анонс свободной языковой модели BLOOM BigScience large open-science open-access multilingual language model стал громким событием, то в 2023 году IT-комьюнити представило сотни опенсорсных нейронок. Начало этому процессу положила представленная в феврале 2023 года цукерберговская модель LLaMA , а затем её более продвинутый вариант LLaMA 2 , разработанный совместно с Microsoft. Нейросетка, представленная в типоразмерах на 7, 13, 33, 65 и 70 миллиардов параметров, по ряду показателей показала результаты, сопоставимые с GPT-3. Цукерберг решил сыграть против тренда на закрытость и объявил, что LLaMA будет доступна с рядом ограничений для научных организаций, которые его компания посчитает заслуживающими доверия.
Но модель вскоре «утекла» в интернет , где её начали распространять и «допиливать» энтузиасты ИИ и свободного ПО. Она стала основой для множества проектов, развивающих модель за счёт экспериментов с архитектурой, вариантами тонкой настройки и обучения.
Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций Роскомнадзор. Отдельные публикации могут содержать информацию, не предназначенную для пользователей до 16 лет. Интернет-журнал Новая Наука каждый день сообщает о последних открытиях и достижениях в области науки и новых технологий.
Число опенсорсных проектов и их конкуренция продолжит расти. Стоимость внедрения и дообучения LLM снижается. Так, доработка и запуск нейросети Alpaca обошлись в 600 долларов. Один из механизмов снижения стоимости — использование «синтетических» данных, созданных ИИ. Французский стартап Mistral AI в первый год своего существования привлёк 385 миллионов евро инвестиций. Это может стать прецедентом финансирования опенсорсных моделей за счёт инвесторов. Чего ждать в 2024 году Главное — появления ещё большего числа дешёвых и эффективных моделей с открытым исходным кодом от небольших стартапов и крупных компаний. Отрасль ИИ станет меньше зависеть от IT-гигантов. В новом году ждём от них самых навороченных нейронок. Опенсорсные модели займут нишу простых и доступных по стоимости решений. На их основе будут созданы персональные ИИ-ассистенты нового поколения, способные работать в смартфонах и других гаджетах. Мы ждём, что рост конкуренции в опенсорс-сообществе приведёт к появлению прорывных технологий, а не только к количественному усложнению моделей. Например, могут появиться новые способы обучения или архитектуры нейросетей, лишённые недостатков предшественников. Не стоит забывать про опасности Open Source. В отсутствие контроля хакеры и интернет-мошенники начнут использовать генеративный интеллект для противозаконных действий. Например, для создания вирусов, взлома паролей или кражи денег с помощью социальной инженерии, создавая «двойников» людей для телефонных или даже видеозвонков. В 2023 году основной прорыв в массовом использовании нейронок с открытым кодом внесла LLaMA, на базе которой появились десятки моделей: Mistral, Zephyr , Alpaca, Phi-2 , Qwen, Yi и другие. В развити опенсорсных моделей просматриваются три тренда, которые усилятся в 2024 году: Желание пользователей устанавливать нейросети на свои устройства и использовать их без подключения к интернету и, соответственно, без оплаты услуг компаний. Раньше качества нейросетей, а также мощностей ноутбуков и смартфонов для этого не хватало, но теперь их достаточно. Поэтому происходит массовый отток пользователей от платных сервисов. Замена людей в процессе получения обратной связи при обучении ИИ-моделей. Это обучение с подкреплением от ИИ, а не от человека. Создание специализированных небольших моделей для медицины, науки, графовых моделей, а также нейросеток с архитектурой MoE. Появление изначально закрытых моделей GPT-3, ChatGPT создало новый рынок, а открытые модели позволили бизнесу использовать их практически без ограничений. Так, например, открытые решения позволяют компаниям контролировать весь процесс работы с данными своих пользователей, адаптировать их под свои нужды и в целом снизить риски, используя собственную инфраструктуру. Кроме того, появление открытых моделей стало причиной роста компетенций академического сообщества в работе с LLM. Сейчас уже никого не удивишь чат-ботом, сравнимым с ChatGPT, который запущен на ноутбуке каким-то энтузиастом, хотя ещё два года назад это казалось фантастикой. Такой уровень доступности технологий позволил учёным опубликовать уже сотни, если не тысячи интересных и полезных научных статей. Роман Душкин генеральный директор ООО «А-Я эксперт» , компании — разработчика систем искусственного интеллекта — Опенсорсные LLM должны быть открытыми не только с точки зрения исходного кода самих моделей, но и с точки зрения данных, на которых они обучаются. И я думаю, что в будущем году упор будет сделан именно на это — на чистоту и прозрачность. У инженеров, учёных и государства при использовании решений на базе открытых моделей ИИ всегда будут возникать вопросы доверия к ним. Поэтому только открытость и высокое качество датасетов, на которых тренируются нейросети, позволят опенсорсным моделям занять свой рыночный сегмент. Рост мультимодальных возможностей нейросетей Что случилось за год У ИИ появилась мультимодальность — теперь нейросети работают не только с текстом, но и с изображениями, видео и аудио.
Какие задачи можно решить с помощью ИИ? Импорт-экспорт присутствует почти в любой CMS-системе или маркетплейсе, поэтому не составит труда сгенерировать с помощью нейросети тексты описаний товаров, SEO-теги, для ваших продуктов или услуг. Генерация мета-тегов и текстов на сайте с учетом ключевых слов важна для SEO-продвижения. Во-первых, это позволяет оптимизировать сайт для поисковых систем, улучшая его видимость и рейтинг в результатах поиска. Во-вторых, использование ключевых слов в мета-тегах и текстах помогает привлечь целевую аудиторию, увеличивая вероятность привлечения потенциальных клиентов и повышения конверсии. Используйте ключевые слова, корректно формулируйте запрос для получения качественных, уникальных Title, Description и текстовых описаний от чат-бота для вашего сайта. Во-первых, она позволяет создавать уникальные и привлекательные описания товаров, которые помогут привлечь внимание потенциальных покупателей и увеличить конверсию продаж. Во-вторых, такой подход значительно экономит время и усилия, которые обычно требуются для составления описаний вручную, позволяя сосредоточиться на других аспектах бизнеса. Генерируйте продающие тексты с учетом ключевых слов для SEO-продвижения карточек на маркетплейсе, размещайте полученные описания, импортируя готовую таблицу в личный кабинет торговой онлайн-площадки 03 Генерация отзывов и ответов Генерация отзывов и ответов на них будет полезна для работы с имиджем компании.
За год GigaChat от Сбера воспользовались 90 миллионов раз
Во-вторых, такой подход значительно экономит время и усилия, которые обычно требуются для составления описаний вручную, позволяя сосредоточиться на других аспектах бизнеса. Генерируйте продающие тексты с учетом ключевых слов для SEO-продвижения карточек на маркетплейсе, размещайте полученные описания, импортируя готовую таблицу в личный кабинет торговой онлайн-площадки 03 Генерация отзывов и ответов Генерация отзывов и ответов на них будет полезна для работы с имиджем компании. Во-первых, это позволяет создать большой объем положительных отзывов и конструктивных ответов быстро и эффективно, что повышает репутацию вашего бизнеса. Во-вторых, такой подход позволяет поддерживать активное взаимодействие с клиентами, улучшая их впечатления и укрепляя связь с вашей компанией. Модуль использует языковую модель gpt-3. Также в решении можно указать логин от аккаунта сервиса Mitup. Подробнее о модуле Бесплатные онлайн-чаты с ИИ Нейросеть обучается на больших объемах текстовых данных и способна генерировать качественные и логичные материалы на основе заданной информации. Каждая модель генерации имеет свои уникальные особенности, которые позволяют создавать контент определенного типа с высокой релевантностью.
Способен создавать полезные Title, Description и тексты для товаров и услуг.
Молекулы могут иметь много разных параметров. Чтобы синтезировать и протестировать все потенциально эффективные формулы, фармацевтам элементарно не хватает времени и ресурсов. Цикл создания нового лекарственного препарата может составлять до пяти лет. Но вот это моделирование разных молекул и прогнозирование свойств вещества исходя из устройства молекулы — отличная задача для искусственного интеллекта.
Так вот, британский стартап совместно с японской фармацевтической компанией нашёл с помощью ИИ формулу потенциально нового средства от обсессивно-компульсивного расстройства. Скоро в Японии пройдёт первый этап его клинического тестирования. Вы могли видеть об этом заголовки вроде «ИИ создал новое лекарство», но всё немного сложнее. Новое вещество может стать лекарством только после нескольких этапов клинических испытаний — оно должно оказаться эффективным, не токсичным и так далее. То, что удалось сделать с помощью ИИ — по сути, дотестовая оптимизация, то есть лишь начальный этап разработки лекарства.
Без ИИ формулы таких лекарств подбирают 2-3 года. Здесь же ИИ справился с перебором разных комбинаций и параметров молекулы всего за год. В общем, всё как в большинстве новостей про ИИ — машины пока не дают таких фантастических результатов, как хотелось бы то есть до «нажали кнопку — получили новое лекарство» ещё очень далеко , но позволяют заметно оптимизировать рутинные процессы. Создание анимаций с большими значениями FPS Следующий пример искусственного интеллекта позволяет создавать новые кадры в видео и анимациях, делая движение объектов более гладким. Вот пример с Чебурашкой.
В 2022 году в открытом доступе также появилась модель YaLM 100B на 100 млрд, которая умеет генерировать тексты на русском и английском языках. Это самые мощные суперкомпьютеры в России и Восточной Европе. У нас очень сильная команда разработчиков и экспертов в области машинного обучения, которая постоянно расширяется", — поделился собеседник "ДП". ИИ повсюду Дмитрий Иванков, эксперт Центра искусственного интеллекта СКБ "Контур", отмечает, что есть ещё множество российских нейросетей, на которые стоит обратить внимание. Это приложение для генерации изображений, которое после выпуска, а также благодаря хорошему продвижению попало в топ—чарт российского App Store. При этом обучение модели всё ещё продолжается для бета—версии было использовано 240 млн примеров картинок из 500 млн доступных компании. И разработчики обещают в дальнейшем поэтапно улучшать качество получаемых изображений.
Вячеслав Борисов, владелец продукта "Сфера. Данная сеть может повышать качество и разрешение видео", — говорит эксперт. Многие опрошенные эксперты отмечают, что индустрия нейросетей в России развивается стремительно. Бизнес давно обратил внимание на искусственный интеллект и применяет его в разных областях: чат—боты, голосовые помощники, сервисы, системы модерации контента на сайтах и маркетплейсах.
В настоящий момент пользователи могут взаимодействовать с сервисом «Нейро» в приложении «Яндекс с Алисой» и в «Яндекс Браузере».
Для использования сервиса потребуется авторизоваться с учётной записью «Яндекса» и переключить соответствующий тумблер, расположенный рядом с поисковой строкой. Компания хочет сформировать партнёрские отношения с представителями индустрии развлечений и предложить кинематографистам использовать в своей работе новый ИИ-сервис для генерации видео Sora, пишет Bloomberg со ссылкой на источники. Источник изображения: Andrew Neel До этого, в конце февраля главный операционный директор OpenAI Брэд Лайткеп Brad Lightcap вместе с коллегами демонстрировал в Голливуде возможности Sora, позволяющего генерировать реалистичные видеоролики продолжительностью до минуты на основе текстовых подсказок пользователей. Несколько дней спустя гендиректор OpenAI Сэм Альтман Sam Altman посетил мероприятия в Лос-Анджелесе, посвящённые церемонии вручения премии Оскар, на которых, по всей видимости тоже информировал представителей медиабизнеса о возможностях Sora. OpenAI представила ИИ-генератор видео Sora в середине февраля, и его возможности сразу привлекли внимание Голливуда и Кремниевой долины.
Хотя нейросеть Sora пока недоступна для широкой публики, ею уже могут воспользоваться некоторые известные актёры и режиссёры. Лидирующая в этом сегменте Runway ранее сообщила Bloomberg, что её сервис преобразования текста в видео Runway Gen-2 уже используют миллионы людей, включая профессионалов производственных и анимационных студий, которые полагаются на него при предварительной визуализации и раскадровке. Монтажёры фильмов с помощью сервиса создают видеоролики, сочетая их с другим отснятым контентом для создания рекламных роликов или визуальных эффектов. Источник изображения: Pixabay По данным источника, Google активировала функцию ИИ-поиска для «небольшого процента поискового трафика в США», в связи с чем пользователи на территории страны могут увидеть сгенерированный нейросетью раздел, даже если они не активировали соответствующую опцию. К ноябрю прошлого года эта функция была развёрнута в 120 странах и могла обрабатывать запросы на множестве языков, но по-прежнему оставалась отключённой по умолчанию.
Источник изображения: Google На данном этапе Google будет показывать пользователям сгенерированный ИИ блок при обработке сложных запросов или в случаях, когда поисковик посчитает, что пользователю будет полезно получить информацию по интересующему его вопросу из нескольких источников. Также отмечается, что сгенерированный нейросетью блок будет выводиться только в случаях, когда алгоритм определит, что результат работы ИИ предоставляет более качественную информацию, чем обычная поисковая выдача. Вероятно, Google проводит тестирование функции ИИ-поиска, чтобы получить больше отзывов от пользователей с целью дальнейшей интеграции нейросетей в свой поисковик. Тем временем разработчики могут опробовать Gemini 1. Источник изображения: Google Gemini 1.
За один раз Gemini 1. В ходе исследования Google также успешно протестировала обработку до 10 млн токенов. Gemini 1. Нейросеть способна не только анализировать большие блоки данных, но и быстро находить определённый фрагмент текста внутри них. Также Gemini 1.
В интерфейсе AI Studio нейросеть сейчас доступна с ограничением в 20 запросов в день. Источник изображения: nasa. Авторы проекта попытались заменить стандартные алгоритмы анализа данных TIRA нейросетями семейства YOLO, которые применяются для поиска движущихся объектов на снимках. Версии нейросетей YOLOv5 и YOLOv8 обучили при помощи массива из 3000 снимков околоземного пространства и проверили их эффективность на примере 600 изображений с радаров, на которых были от одного до трёх частиц космического мусора. Результат оказался выше того, что демонстрирует стандартный алгоритм TIRA.
Учёные сделали вывод, что системы машинного зрения могут успешно применяться для поиска космического мусора в околоземном пространстве и для его отслеживания в реальном времени. Это поможет снизить число инцидентов, связанных с попаданием частиц космического мусора в работающие орбитальные аппараты. По оценкам экспертов, на орбите Земли могут находиться более 170 млн частиц космического мусора. Stable Diffusion 3. Источник изображений: Stable Diffusion 3.
Выпуск SDXL в июле значительно улучшил базовую модель Stable Diffusion, и теперь компания собирается пойти значительно дальше. Новая модель Stable Diffusion 3. Новая нейросеть обеспечит значительно лучшую типографику, чем предыдущие версии Stable Diffusion, обеспечивая более точное написание текста внутри сгенерированных изображений. В прошлом типографика была слабой стороной Stable Diffusion, собственно, как и многих других ИИ-художников. Stability AI экспериментирует с несколькими типами подходов к созданию изображений.
Трансформеры лежат в основе большей части современных нейросетей, запустивших революцию в области искусственного интеллекта. Они широко используются в качестве основы моделей генерации текста. Генерация изображений в основном находилась в сфере диффузионных моделей. В исследовательской работе , в которой подробно описываются диффузионные трансформеры DiT , объясняется, что это новая архитектура для диффузионных моделей, которая заменяет широко используемую магистраль U-Net трансформером, работающим на скрытых участках изображения. Применение DiT позволяет более эффективно использовать вычислительные мощности и превосходить другие подходы к диффузной генерации изображений.
Еще одна важная инновация, которой пользуется Stable Diffusion 3. В исследовательской работе по сопоставлению потоков объясняется, что это новый метод обучения нейросетей с помощью «непрерывных нормализующих потоков» Conditional Flow Matching — CNF для моделирования сложных распределений данных. По мнению исследователей, использование CFM с оптимальными путями транспортировки приводит к более быстрому обучению, более эффективному отбору образцов и повышению производительности по сравнению с диффузионными путями. Улучшенная типографика в Stable Diffusion 3. Как пояснил Мостак, качественная генерация текстов на изображения стала возможной благодаря использованию диффузионной модели-трансформера и дополнительных кодировщиков текста.