Теперь нейросеть, подобно опытному фокуснику, формирует промежуточное представление картинки в виде латентного кода — своеобразной «шпаргалки», содержащей квинтэссенцию. Нейросеть может сделать снимки цветными или восстановить недостающие элементы в кадре, которые по определенным причинам были утрачены со временем.
Малевича заменили нейросетью
16 декабря прошло закрытое мероприятие в честь запуска Relictum NFT Marketplace, где в продажу поступил уникальный токен работы Малевича. Вместе с тем, чем активнее развиваются нейросети, тем сложнее становится отличать их «творения» от работ обычных людей. Суть инновационного проекта заключается в том, чтобы научить нейросеть распознавать на снимках злокачественные новообразования и классифицировать рак легких на ранней стадии. В воронежском музее нейросеть создала картины известных художников. Калининградка с помощью нейросети Midjourney показала, каким бы увидели город великие художники. Нейронная сеть, используемая для создания выставки, была обучена на наборе данных тысяч известных картин, что привело к уникальному сочетанию знакомого стиля и новых творческих.
НЕЙРО-МАЛЕВИЧ
- Примеры запросов и стилей генерации изображений
- Всё как у людей: как отличить рисунки нейросети от работ художников | Статьи | Известия
- Еще материалы
- Что такое ruDALL E
- Telegram: Contact @rusmuseum
Нейросети для генерации картинок: Midjourney, DALL-E, Google Imagen и Artbreeder
⚡ «Малевич»: россиянам продемонстрировали нейросеть будущего | Любая нейросеть представляет собой математическую модель, работающую по принципам, которые очень похожи на работу человеческого мозга. |
Нейросети для генерации картинок: Midjourney, DALL-E, Google Imagen и Artbreeder | фамилия известного художника-супрематиста, отражает взгляд компании на архитектуру для жизни. |
Нейросети для генерации картинок: Midjourney, DALL-E, Google Imagen и Artbreeder | Временно исполняющая обязанности генерального директора Русского музея — о запуске нейросети. |
Боты нейросетей в Телеграме: как подключить и пользоваться | «Нейронные сети и машинное обучение приведут к ускорению развития»: ведущий IT-эксперт Аралтан Горяев оценивает будущее индустрии. |
Для выставки в Москве нейросеть создала картины на основе полотен Дали, да Винчи и Мухи
Русский музей к 125-летию со дня открытия запустил собственную нейросеть в своем сообществе во «ВКонтакте». В преддверии 9 мая открыла доступ к нейросети, которая позволяет бесплатно отреставрировать старые фотографии. Популярная нейросеть Stable Diffusion XL позволяет настраивать точность соответствия запросу, число шагов и прочие параметры генерации. Нейросеть Kandinsky 2.1 была обучена разработчиками из Sber AI при поддержке учёных из Института искусственного интеллекта AIRI на объединённом наборе данных Sber AI и компании. The models ruDALL-E Malevich (XL), ruDALL-E Kandinsky (XXL), ruCLIP Small, ruCLIP Large, and Super Resolution (Real ESRGAN) will also soon be available on DataHub.
Владимир Малевич - новости
Вологодские студенты обучили нейросеть распознавать рак легких Копировать ссылку Свой инновационный проект команда студентов Института математики, естественных и компьютерных наук ИМЕиКН Вологодского госуниверситета представила в рамках международного форума «Молодые исследователи — регионам». Команда студентов ВоГУ — Павел Смирнов, Елизавета Шувалова, Сергей Смекалов под руководством доцента кафедры автоматики и вычислительной техники Георгия Рапакова работала над тем, чтобы обучить нейросеть распознавать на снимках злокачественные новообразования на ранней стадии, а также классифицировать рак легких. В основе метода распознавания рака легких, от которого отталкиваются вологодские студенты — традиционная обработка изображений нейросетью. Из них 17 тысяч снимков были использованы для обучения нейросети, а 5 тысяч — для тестирования.
Однако использование пикселей непосредственно в качестве признаков изображений потребует чрезмерного количества памяти, особенно для изображений с высоким разрешением.
Чтобы не учить только краткосрочные зависимости между пикселями и текстами, а делать это более высокоуровнево, обучение модели проходит в 2 этапа: Предварительно сжатые изображения с разрешением 256х256 поступают на вход автоэнкодера мы обучили свой SBER VQ-GAN, улучшив метрики для генерации по некоторым доменам, и об этом как раз рассказывали тут , причем также поделились кодом , который учится сжимать изображение в матрицу токенов 32х32. Фактор сжатия 8 позволяет восстанавливать изображение с небольшой потерей качества: см. Для токенизации текстов использовался токенизатор YTTM. Публикация описывает её общими словами, но обходит вниманием некоторые важные нюансы реализации.
Он включает такие детали, как позиционное кодирование блоков картинки, свёрточные и координатные маски Attention-слоёв, общее представление эмбеддингов текста и картинок, взвешенные лоссы для текстов и изображений, dropout-токенизатор. Из-за огромных вычислительных требований эффективно обучать модель можно только в режиме точности fp16. Это в 5-7 раз быстрее, чем обучение в классическом fp32. Кроме того, модель с таким подходом занимает меньше места.
Но ограничение точности представления чисел повлекло за собой множество сложностей для такой глубокой архитектуры: a иногда встречающиеся очень большие значения внутри сети приводят к вырождению лосса в Nan и прекращению обучения; b при малых значениях learning rate, помогающих избежать проблемы а , сеть перестает улучшаться и расходится из-за большого числа нулей в градиентах. Для решения этих проблем мы имплементировали несколько идей из работы китайского университета Цинхуа CogView , а также провели свои исследования стабильности, с помощью которых нашли ещё несколько архитектурных идей, помогающих стабилизировать обучение. Так как делать это приходилось прямо в процессе обучения модели, путь тренировки вышел долгим и тернистым. Сбор данных и их фильтрация: безусловно, когда мы говорим об архитектуре, нововведениях и других технических тонкостях, нельзя не упомянуть такой важный аспект как данные.
Липецк в советской мультяшной прорисовке отображает классику застройки СССР — оживленные улицы, где разнотипные многоэтажки в окружении зелени соседствуют с небольшими зданиями. Липецк руки Айвазовского получился мрачный, несмотря на утреннюю зарю. Город больше напоминает глубинку дореволюционной России с бездорожьем, заснеженными деревьями и храмом на фоне небольших строений.
Из-за огромных вычислительных требований эффективно обучать модель можно только в режиме точности fp16. Это в 5-7 раз быстрее, чем обучение в классическом fp32. Кроме того, модель с таким подходом занимает меньше места. Но ограничение точности представления чисел повлекло за собой множество сложностей для такой глубокой архитектуры: a иногда встречающиеся очень большие значения внутри сети приводят к вырождению лосса в Nan и прекращению обучения; b при малых значениях learning rate, помогающих избежать проблемы а , сеть перестает улучшаться и расходится из-за большого числа нулей в градиентах.
Для решения этих проблем мы имплементировали несколько идей из работы китайского университета Цинхуа CogView , а также провели свои исследования стабильности, с помощью которых нашли ещё несколько архитектурных идей, помогающих стабилизировать обучение. Так как делать это приходилось прямо в процессе обучения модели, путь тренировки вышел долгим и тернистым. Сбор данных и их фильтрация: безусловно, когда мы говорим об архитектуре, нововведениях и других технических тонкостях, нельзя не упомянуть такой важный аспект как данные. Как известно, для обучения трансформеров их должно быть много, причем «чистых». Под «чистотой» мы понимали в первую очередь хорошие описания, которые потом нам придётся переводить на русский язык, и изображения с отношением сторон не хуже 1:2 или 2:1, чтобы при кропах не потерять содержательный контент изображений. Первым делом мы взялись за те данные, которые использовали OpenAI в статье указаны 250 млн. Ключевыми доменами стали люди, животные, знаменитости, интерьеры, достопримечательности и пейзажи, различные виды техники, деятельность людей, эмоции.
После сбора и фильтрации данных от слишком коротких описаний, маленьких изображений и изображений с непригодным отношением сторон, а также изображений, слабо соответствующих описаниям мы использовали для этого англоязычную модель CLIP , перевода всех английских описаний на русский язык, был сформирован широкий спектр данных для обучения — около 120 млн. Хочется отдельно упомянуть сложность выбора оптимальных режимов генерации для разных объектов и доменов.
Напрасный труд
- Как работают боты для рисования картинок в «Телеграме»
- Нейросеть Малевич создала герб Брянской области | Новости Брянска
- VK / Нейросеть поможет отреставрировать фотографии
- Нейросеть Сбера Kandinsky 2.1 пользуется огромной популярностью
- Нейросеть «Кандинский» будет рисовать фотороботы подозреваемых в совершении преступлений
- Создана первая нейросеть для мастеров красоты «Малевич»
Информация
- NVIDIA представила ИИ, который генерирует видео с высоким разрешением по текстовому описанию
- Вологодские студенты обучили нейросеть распознавать рак легких - МК Вологда
- Как работают боты для рисования картинок в «Телеграме»
- Как воспользоваться нейросетью
Вологодские студенты обучили нейросеть распознавать рак легких
Брюллов, В. Серов, М. Врубель, К. Малевич, П.
Энди Уорхолла, Роя Лихтенштейна и других мастеров. Во дворцах и садах Русского музея, на его интернет-ресурсах мы рады представить нашим реальным и виртуальным посетителям шедевры великих мастеров прошлого и произведения наших современников. ВКонтакте помогают нам привлекать новую аудиторию, рассказывать об искусстве, знакомить с выдающимся художественным собранием музея. С помощью новейших современных технологий мы можем показать подписчикам избранные полотна из нашего собрания и увидеть, как нейросетью трактуются известные художественные образы.
Татьяна Тюменева Санкт-Петербург Государственный Русский музей запустил собственную нейросеть в своей официальной группе в соцсети "В Контакте". С помощью искусственного интеллекта можно получить свой собственный портрет, как будто бы написанный рукой кого-то из великих художников, рассказали в пресс-службе музея. Все произведения, из которых нейросеть может сгенерировать ваше изображение, находятся в коллекции музея. Разработчиками проекта проанализировано более ста картин.
Модель запоминает детали разговора и может строить ответы, основываясь на информации, которую ей уже сообщил пользователь. Работает с русским языком, но с английским справляется намного лучше. GPT-4 лучше учитывает контекст, умеет распознавать изображения, хорошо работает с русским языком и сдает сложные экзамены на уровне отличников. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. Я попыталась проверить несколько ботов, на какой версии GPT они работают: спрашивала об этом в самом чате. Не врет! Модель не распознает контекст и создает менее креативный текст. Есть ли боты именно с ChatGPT.
«СберКарту» теперь можно украсить картинами Малевича и Коровина
Для создания этих произведений искусства нейросеть прошла обучение по творчеству современных художников, среди которых оказался Такаши Мураками. [моё] Digital Цифровой рисунок Нейронные сети Арты нейросетей Супрематизм Авангард Философия Искусство Искусственный интеллект Текст Казимир Малевич Midjourney. Для обучения нейросети использованы опубликованные в широком доступе фотографии и видео.