PaLM — Википедия

PaLM (англ. Pathways Language Model) — это большая языковая модель на основе архитектуры трансформера с 540 миллиардов параметров, разработанная Google AI^[1]. Исследователи также создали версии модели PaLM с 8 и 62 миллиардами параметров, чтобы проверить влияние масштаба^[2].

PaLM способен выполнять широкий спектр задач, включая логические рассуждения, арифметические рассуждения, объяснение шуток, генерацию кода и перевод текстов^[2]^[3]^[4]^[5]. В сочетании с подсказками по цепочке рассуждений PaLM достигла значительно более высокой производительности при работе с наборами данных, требующими логических выводов в несколько этапов, таких как текстовые задачи и логические вопросы^[1]^[2].

Впервые об этой модели было объявлено в апреле 2022 года, и она оставалась закрытой до марта 2023 года, когда Google запустил API для работы с PaLM и другими технологиями^[6]. Сообщалось, что сначала API будет доступен для ограниченного числа разработчиков, которые присоединятся к списку ожидания, прежде чем он будет открыт для широкой публики^[7].

Google и DeepMind разработали версию PaLM 540B под названием Med-PaLM, которая тонко настроена на медицинские данные и превосходит предыдущие модели в тестах где нужно отвечать на медицинские вопросы^[8]^[9]. Med-PaLM была первой моделью, которая получила проходной балл по вопросам медицинского лицензирования в США, и в дополнение к точным ответам как на вопросы с множественным выбором, так и на открытые вопросы, она также предоставляет аргументы и может оценивать свои собственные ответы^[10].

Google также расширил PaLM с помощью ViT^[англ.], чтобы создать PaLM-E, современную языковую модель со зрением, которую можно использовать в робототехнике^[11]^[12]. Модель может соревновательно выполнять задачи по робототехнике без необходимости переобучения или тонкой настройки^[13].

Обучение[править | править код]

PaLM предварительно обучена на высококачественном корпусе из 780 миллиардов токенов, которые включают в себя различные задачи на естественном языке и варианты использования. Этот набор данных включает отфильтрованные веб-страницы, книги, статьи в Википедии, новостные статьи, исходный код, полученный из репозиториев с открытым исходным кодом на GitHub, и разговоры в социальных сетях^[1]^[2]. Она основана на наборе данных, используемом для обучения модели Google LaMDA^[2]. Часть набора данных, посвященная разговорам в социальных сетях, составляет 50 % корпуса, что помогает модели в её диалоговых возможностях^[2].

PaLM 540B была обучена на двух модулях TPU v4 с 3072 чипами TPU v4 в каждом модуле, подключенными к 768 хостам, подключённым с использованием комбинации модели и параллелизма данных, что является крупнейшей конфигурацией TPU, описанной на сегодняшний день^[2]^[14]. Это позволило провести эффективное обучение в масштабе с использованием 6 144 чипов, что стало рекордом максимальной эффективности обучения, достигнутой для LLM в этом масштабе с использованием аппаратных FLOP на 57,8 %^[3].

Примечания[править | править код]

↑ ¹ ² ³ Narang; Chowdhery, Aakanksha Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance (англ.). ai.googleblog.com. Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.
↑ ¹ ² ³ ⁴ ⁵ ⁶ ⁷ Chowdhery, Aakanksha (2022). "PaLM: Scaling Language Modeling with Pathways". doi:10.48550/arXiv.2204.02311. {{cite journal}}: Cite journal требует |journal= (справка)
↑ ¹ ² Anadiotis. Google sets the bar for AI language models with PaLM (неопр.). VentureBeat (12 апреля 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.
↑ Bastian. Google PaLM: Giant language AI can explain jokes (неопр.). THE DECODER (5 апреля 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.
↑ Google: Why Is No One Talking About PaLM (NASDAQ:GOOG) | Seeking Alpha (англ.). seekingalpha.com (12 декабря 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.
↑ Vincent. Google opens up its AI language model PaLM to challenge OpenAI and GPT-3 (неопр.). The Verge (14 марта 2023). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.
↑ Huffman; Woodward, Josh PaLM API & MakerSuite: an approachable way to start prototyping and building generative AI applications (англ.). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.
↑ Singhal, Karan (2022). "Large Language Models Encode Clinical Knowledge". doi:10.48550/arXiv.2212.13138. {{cite journal}}: Cite journal требует |journal= (справка)
↑ MedPaLM: New Chatbots Will Soon Be Better Than Waiting For A Doctor (неопр.). The Medical Futurist (17 января 2023). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.
↑ Matias; Corrado, Greg Our latest health AI research updates (амер. англ.). Google (14 марта 2023). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.
↑ Driess, Danny (2023). "PaLM-E: An Embodied Multimodal Language Model". doi:10.48550/arXiv.2303.03378. {{cite journal}}: Cite journal требует |journal= (справка)
↑ Driess; Florence, Pete PaLM-E: An embodied multimodal language model (англ.). ai.googleblog.com. Дата обращения: 17 марта 2023. Архивировано 20 марта 2023 года.
↑ Benj Edwards. Google’s PaLM-E is a generalist robot brain that takes commands (амер. англ.). Ars Technica (7 марта 2023). Дата обращения: 11 марта 2023. Архивировано 11 марта 2023 года.
↑ An empirical analysis of compute-optimal large language model training (англ.). www.deepmind.com. Дата обращения: 17 марта 2023. Архивировано 26 марта 2023 года.

[blog-1] ¹ ² ³ Narang; Chowdhery, Aakanksha Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance (англ.). ai.googleblog.com. Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.

[paper-2] ¹ ² ³ ⁴ ⁵ ⁶ ⁷ Chowdhery, Aakanksha (2022). "PaLM: Scaling Language Modeling with Pathways". doi:10.48550/arXiv.2204.02311. {{cite journal}}: Cite journal требует |journal= (справка)

[venturebeat-3] ¹ ² Anadiotis. Google sets the bar for AI language models with PaLM (неопр.). VentureBeat (12 апреля 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.

[4] Bastian. Google PaLM: Giant language AI can explain jokes (неопр.). THE DECODER (5 апреля 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.

[5] Google: Why Is No One Talking About PaLM (NASDAQ:GOOG) | Seeking Alpha (англ.). seekingalpha.com (12 декабря 2022). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.

[6] Vincent. Google opens up its AI language model PaLM to challenge OpenAI and GPT-3 (неопр.). The Verge (14 марта 2023). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.

[7] Huffman; Woodward, Josh PaLM API & MakerSuite: an approachable way to start prototyping and building generative AI applications (англ.). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.

[8] Singhal, Karan (2022). "Large Language Models Encode Clinical Knowledge". doi:10.48550/arXiv.2212.13138. {{cite journal}}: Cite journal требует |journal= (справка)

[9] MedPaLM: New Chatbots Will Soon Be Better Than Waiting For A Doctor (неопр.). The Medical Futurist (17 января 2023). Дата обращения: 17 марта 2023. Архивировано 17 марта 2023 года.

[10] Matias; Corrado, Greg Our latest health AI research updates (амер. англ.). Google (14 марта 2023). Дата обращения: 17 марта 2023. Архивировано 21 марта 2023 года.

[11] Driess, Danny (2023). "PaLM-E: An Embodied Multimodal Language Model". doi:10.48550/arXiv.2303.03378. {{cite journal}}: Cite journal требует |journal= (справка)

[12] Driess; Florence, Pete PaLM-E: An embodied multimodal language model (англ.). ai.googleblog.com. Дата обращения: 17 марта 2023. Архивировано 20 марта 2023 года.

[13] Benj Edwards. Google’s PaLM-E is a generalist robot brain that takes commands (амер. англ.). Ars Technica (7 марта 2023). Дата обращения: 11 марта 2023. Архивировано 11 марта 2023 года.

[14] An empirical analysis of compute-optimal large language model training (англ.). www.deepmind.com. Дата обращения: 17 марта 2023. Архивировано 26 марта 2023 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Google LLC
Председатель совета директоров: Эрик Шмидт Директор, президент по технологиям и сооснователь: Сергей Брин Главный исполнительный директор и сооснователь: Ларри Пейдж Материнская компания: Alphabet
Реклама	AdMob Adscape^[англ.] AdSense Advertising Professional^[англ.] Ads Analytics DoubleClick Insights for Search Trends Wallet Google Университет^[англ.]
Коммуникации	Allo Google+ Calendar Friend Connect Duo Gmail Inbox Groups Hangouts Meet Messages Вопросы и ответы^[англ.] Talk Translate Voice
ПО	Chrome Chromium Earth Gadgets Goggles Now SketchUp Talk Google Assistant Toolbar
Платформы	Account Android App Engine BigTable Chromecast Chrome OS Google Workspace Пользовательский поиск Native Client GFS Nexus OpenSocial Pixel Play Public DNS Stadia TV Fuchsia
Инструменты разработки	Android Studio Dart Gadgets API^[англ.] GData^[англ.] Go Googlebot Guice GWS Highly Open Participation Contest^[англ.] KML MapReduce Mediabot^[англ.] Pinyin^[англ.] SketchUp Ruby^[англ.] Sitemaps (index) Summer of Code AtGoogleTalks^[англ.] Web Toolkit Google Website Optimizer
Публикация	Alerts Blogger Bookmarks^[англ.] Документы FeedBurner Library Project^[англ.] Map Maker Sites YouTube Диск Фото Keep
Поиск (PageRank)	Appliance Audio^[англ.] Books Images Maps (Mars Moon Ocean^[англ.] Sky Street View) News Patents^[англ.] Покупки Scholar Usenet Video Web
Тематические проекты	Finance Google Glass Беспилотный автомобиль Google Loon Проект Tango Google Cardboard Noto Code Jam
Закрытые проекты	Вопросы и ответы^[англ.] Browser Sync Base Buzz Checkout Click-to-call^[англ.] Code Desktop Dodgeball^[англ.] Gears GOOG-411 Health iGoogle Image Labeler^[англ.] Jaiku Knol Labs Lively^[англ.] Mashup Editor^[англ.] Notebook Orkut Pack Panoramio Picasa Page Creator Picnik Reader SearchWiki^[англ.] Updater Video Marketplace^[англ.] Wave Web Accelerator Google Play Music
См. также	История Поглощения Список сервисов и инструментов Логотип Doodle Цензура^[англ.] Ara Arts & Culture Calico Current^[англ.] Earth Outreach^[англ.] Foundation (Google.org) Google China^[англ.] Googleplex Google X Lunar X Prize I/O WiFi^[англ.] Zeitgeist^[англ.] «Бомбы» Гуглизация Dinosaur Game

Обработка естественного языка
Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Сегментация текста^[англ.] Частеречная разметка Поверхностно-синтаксический анализ Обработка сложных слов^[англ.] Извлечение коллокаций^[англ.] Стемминг Лемматизация Распознавание именованных сущностей^[англ.] Разрешение кореферентности Анализ тональности текста Извлечение концептов^[англ.] Синтаксический анализ Разрешение лексической многозначности Извлечение терминологии^[англ.] Извлечение информации Идентификация языка Определение регистра^[англ.]
Реферирование	Извлечение предложений^[англ.] Генерация реферата Многодокументное реферирование^[англ.] Упрощение текста^[англ.]
Машинный перевод	Автоматизированный Гибридный Интерлингвальный^[англ.] На основе правил На основе примеров На основе словаря^[англ.] На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
Рецензирование	Автоматизированная оценка сочинений^[англ.] Конкордансер Предиктивный ввод текста Система проверки грамматики^[англ.] Система проверки правописания Угадывание синтаксиса^[англ.]
Интерфейс на естественном языке^[англ.]	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература