BLOOM (taalmodel)

BLOOM (BigScience Large Open-access Multilingual Language Model) is een meertalig groot taalmodel (LLM), ontwikkeld met behulp van kunstmatige intelligentie (AI). Het model zou GPT-3 in omvang evenaren, staat gratis ter beschikking van onderzoekers, en werd in 2022 in open source vrijgegeven.^[1]^[2]

Geschiedenis[bewerken | brontekst bewerken]

Het model werd gecreëerd door een groep van ruim duizend vrijwillige onderzoekers in het project BigScience, met financiering van de Franse overheid gecoördineerd door de AI startup Hugging Face. De bouw werd in 117 dagen afgerond op supercomputers van het Franse Centre national de la recherche scientifique (nationaal centrum voor wetenschappelijk onderzoek) nabij Parijs.

Open source[bewerken | brontekst bewerken]

De ontwikkelaars hopen dat het concept een radicale breuk zal vormen met de manier waarop AI gewoonlijk wordt ontwikkeld: in tegenstelling tot andere grote taalmodellen zoals GPT-3 of Googles DeepMind en LaMDA, is Bloom ontworpen om zo transparant mogelijk te zijn. Onderzoekers hebben de datasets genoemd waarmee het is getraind, communiceerden over de uitdagingen bij de ontwikkeling ervan, en gaven uitleg over de manier waarop ze de prestaties van het taalmodel hebben geëvalueerd. Op die manier kunnen externe onderzoekers zich een oordeel vormen, en kritisch bijdragen.^[2]

Gebruik[bewerken | brontekst bewerken]

BLOOM heeft een toegankelijke webinterface voor experimentele toepassingen. Gebruikers kunnen het model een demonstratie vragen,^[3] of een eigen gebruiksruimte (“spaces”) opzetten.

Een volledig BLOOM-checkpoint neemt echter 330 GB schijfruimte in beslag, en gebruikt grafische processors (GPU), te zwaar voor de meeste desktopcomputers. Toch is ook daarvan een lokale versie beschikbaar voor softwareontwikkelaars, mits ten minste 16 GB RAM.^[4]

Zie ook[bewerken | brontekst bewerken]

ChatGPT

Externe link[bewerken | brontekst bewerken]

Bloom-project bij Hugging Face

Bronnen, noten en/of referenties

↑ (en) Kyle Wiggers, A year in the making, BigScience’s AI language model is finally available. techcrunch (12 juli 2022). Gearchiveerd op 30 januari 2023. Geraadpleegd op 28 januari 2023.
↑ ^a ^b (en) Melissa Heikkilä, Inside a radical new project to democratize AI. MIT (12 juli 2022). Gearchiveerd op 4 december 2022.
↑ (en) BigScience BLOOM Language Model: Live DEMO w/ LLM on Policy, Tech, Science and Economy.. YouTube. Gearchiveerd op 31 januari 2023. Geraadpleegd op 30 januari 2023.
↑ (en) Cristian Arleaga, Understand BLOOM, the Largest Open-Access AI, and Run It on Your Local Computer (6 augustus 2022). Gearchiveerd op 31 januari 2023. Geraadpleegd op 28 januari 2023.

[tech22-1] (en) Kyle Wiggers, A year in the making, BigScience’s AI language model is finally available. techcrunch (12 juli 2022). Gearchiveerd op 30 januari 2023. Geraadpleegd op 28 januari 2023.

[MIT2022-2] (en) Melissa Heikkilä, Inside a radical new project to democratize AI. MIT (12 juli 2022). Gearchiveerd op 4 december 2022.

[youtubedemo-3] (en) BigScience BLOOM Language Model: Live DEMO w/ LLM on Policy, Tech, Science and Economy.. YouTube. Gearchiveerd op 31 januari 2023. Geraadpleegd op 30 januari 2023.

[arleaga-4] (en) Cristian Arleaga, Understand BLOOM, the Largest Open-Access AI, and Run It on Your Local Computer (6 augustus 2022). Gearchiveerd op 31 januari 2023. Geraadpleegd op 28 januari 2023.

[1]

[2]

[3]

[4]