Open source DALL-E „Open Diffusion” jest już dostępny na stronie internetowej

Modernizacja

Obraz: stabilny spread

Zaktualizowano 21 sierpnia 2022 r.:

Open Diffusion jest teraz dostępny za pośrednictwem interfejsu internetowego. Po zalogowaniu możesz tworzyć obrazy za pomocą wiadomości tekstowych, podobnie jak DALL-E 2, i masz kilka dodatkowych opcji dostrajania. Podobnie jak w przypadku DALL-E 2, istnieją ograniczenia dotyczące roszczeń, takich jak obrazy seksualne lub przedstawiające przemoc.

Model Open Diffusion, który można uruchomić lokalnie lub w chmurze, nie będzie miał tych ograniczeń. Oczekuje się, że model zostanie uruchomiony na Github w ciągu najbliższych kilku dni.

Możesz wypróbować Web Open Diffusion za darmo. Za równowartość prawie 12 USD możesz kupić około 1000 monitów. Rzeczywista liczba dostępnych roszczeń zależy od złożoności obliczeń i dokładności Twojego obrazu.

Kliknij tutaj, aby przejść do DreamstudioOtwarty interfejs sieciowy dyfuzji.

Oryginalny artykuł datowany jest na 14 sierpnia 2022 r.:

Konkurent open source DALL-E od OpenAI działa na twojej karcie graficznej

DALL-E 2 od OpenAI otrzymuje darmową konkurencję. A za tym jest ruch AI o otwartym kodzie źródłowym i start AI.

Sztuczna inteligencja, która może tworzyć obrazy z opisów tekstowych, robiła szybkie postępy od początku 2021 roku. W tym czasie OpenAI pokazał imponujące wyniki dzięki DALL-E 1 i CLIP. Społeczność open source używała CLIP do kilku alternatywnych projektów w ciągu roku. Następnie w 2022 roku OpenAI wydało imponującą wersję DALL-E 2Google pokazał Obraz A przyjęcieA Medjourney dotarła do milionówA Craiyon zalał media społecznościowe obrazami AI.

Startup Stability AI ogłosił teraz wydanie stabilny spreadkolejny system podobny do DALL-E 2, który będzie stopniowo udostępniany nowym badaczom i innym grupom za pośrednictwem serwera Discord.

READ Chcesz używać Apple CarPlay lub Android Auto w swojej Tesli? Oto jak

Po fazie testów Stable Diffusion zostanie wydane bezpłatnie – wyszkolony kod i model zostaną opublikowane jako open source. Dostępna będzie również wersja hostowana z interfejsem internetowym, w którym użytkownicy będą mogli przetestować system.

Finansowany konkurent stabilności AI za darmo DALL-E 2

Stabilna dyfuzja jest wynikiem współpracy naukowców ze Stability AI, RunwayML, LMU Monachium, EleutherAI i LAION. Grupa badawcza EleutherAI jest najbardziej znana ze swoich modeli języka open source GPT-J-6B i GPT-NeoX-20Ba także prowadzi badania nad modelami multimedialnymi.

Organizacja non-profit LAION (The Open Network for Large Scale Artificial Intelligence) dostarczyła dane treningowe z zestawem danych LAION 5B o otwartym kodzie źródłowym, który został przefiltrowany przez opinie ludzi w początkowej fazie testów, aby stworzyć ostateczny zestaw danych treningowych dla LAION-Aesthetics.

Patryk Esser pas startowy i Robin Rombach z LMU Monachium kierowali projektem, opierając się na ich pracy w CompVis Group na Uniwersytecie w Heidelbergu. Tam stworzyli VQGAN A Utajona dyfuzja. Ten ostatni posłużył jako podstawa dla Stable Diffusion z badaniami OpenAI i Google Brain.

Roboty jazzowe. By TheRealBissy #StableDiffusion #AIArt # Praca Umieść tweeta pic.twitter.com/V6hBWZUuM9

– Stabilne obrazy dyfuzyjne (DiffusionPics) 14 sierpnia 2022

Stability AI, założoną w 2020 roku, wspiera matematyk i informatyk Emad Mosteqi. Przez kilka lat pracował jako analityk dla kilku funduszy hedgingowych, zanim zajął się ogólną działalnością. W 2019 roku pomógł założyć Symmitree, projekt, którego celem jest obniżenie kosztów smartfonów i dostępu do Internetu dla niedocenianych populacji.

Dzięki stabilnej sztucznej inteligencji i własnemu bogactwu Mostaque ma na celu wzmocnienie społeczności badawczej AI typu open source. Jego startup wcześniej wspierał na przykład tworzenie zestawu danych „LAION 5B”. Aby trenować stabilny model wdrażania, Stability AI wprowadziła serwery z 4000 procesorami graficznymi Nvidia A100.

„Nikt nie ma żadnych praw głosu z wyjątkiem naszych 75 pracowników – nie miliarderów, dużych funduszy, rządów ani nikogo innego, kto ma kontrolę nad firmą lub społecznościami, które wspieramy. Jesteśmy całkowicie niezależni” – powiedział Mostak TechCrunch. „Planujemy wykorzystać nasze komputery do przyspieszenia podstawowej sztucznej inteligencji typu open source”.

READ Wysiłki Beepera, aby utrzymać iMessage na Androidzie, stają się coraz bardziej skomplikowane

Stabilne wdrożenie to nauczyciel open source

Obecnie trwają testy stabilnego wdrożenia, a nowe dodatki są rozprowadzane falami. Wyniki, które można zobaczyć na przykład na Twitterze, pokazują tutaj pojawienie się prawdziwego konkurenta DALL-E-2.

Stabilna dyfuzja jest bardziej wszechstronna niż Midjourney, ale ma niższą rozdzielczość niż DALL-E 2. | obrazek: github

W przeciwieństwie do DALL-E 2, stabilna dyfuzja może generować Portrety VIP I inne tematy, które OpenAI jest zabroniony w DALL-E 2. Inne systemy, takie jak Midjourney lub Pixelz.ai, również to potrafią, ale nie osiągają tej samej jakości dzięki wysokiej wszechstronności widocznej w Stable Diffusion – i żaden z innych systemów nie jest open source.

Okazuje się # rozpiętość Naprawdę fajne interpolacje między monitami tekstowymi można wykonać, jeśli naprawisz szum inicjalizacji i błąd między natychmiastowymi wektorami warunkowania: pic.twitter.com/lWOoETYVZ3

– Xander Steenbrugge (@xsteenbrugge) 7 sierpnia 2022

Stable Diffusion już teraz ma działać na jednej karcie graficznej z 5,1 GB pamięci VRAM – dzięki czemu technologia AI jest dostępna na razie tylko za pośrednictwem usług w chmurze. W ten sposób Stable Diffusion zapewnia naukowcom i zainteresowanym stronom bez dostępu do serwerów GPU możliwość doświadczenia nowoczesnego generatywnego modelu AI. Model ma również działać na MacBookach z chipem Apple M1. Jednak wygenerowanie obrazu zajmuje kilka minut zamiast sekund tutaj.

DALL-E 2 firmy OpenAI otrzymuje konkurs open source, prowadzony przez społeczność open source i startup Stability AI. | obrazek: github

Sama Stability AI chce również umożliwić firmom trenowanie swojego wariantu stabilnego wdrożenia. W ten sposób modele multimedialne podążają ścieżką wcześniej obraną przez duże modele językowe: z dala od jednego dostawcy i w kierunku szerokiej dostępności wielu alternatyw poprzez open source.

Runway już szuka możliwości edycji tekstu na wideo z obsługą Stable Diffusion.

READ Potwierdzono, że plemię przetrwało wydanie we wczesnym dostępie

# rozpiętość Punkty kontrolne zamiany tekstu na obraz są teraz dostępne do celów wyszukiwania na żądanie w https://t.co/7SFUVKoUdl

Pracuj nad łagodniejszą edycją i punktami kontrolnymi w farbie.

Już wkrótce ™ nadchodzi Umieść tweeta Edytuj tekst do wideo pic.twitter.com/7XVKydxTeD

– Patrick Esser (@pess_r) 11 sierpnia 2022

Stabilny spread: Puszka Pandory i odsetki netto

Oczywiście przy otwartym dostępie i możliwości uruchomienia modelu na powszechnie dostępnym GPU szansa na nadużycie dramatycznie wzrasta.

„Jest pewien procent ludzi, którzy są po prostu nieprzyjemni i dziwni, ale to jest ludzkość” – powiedział Mustak. „W rzeczywistości uważamy, że ta technologia będzie głównym nurtem, a nieco paternalistyczne i protekcjonalne podejście wielu entuzjastów sztucznej inteligencji jest mylące w nieufności społeczeństwa”.

Mostaki twierdzi jednak, że bezpłatna dostępność pozwala społeczności wymyślać środki zaradcze.

„Podejmujemy znaczące środki bezpieczeństwa, w tym opracowujemy zaawansowane narzędzia, aby pomóc złagodzić potencjalne szkody w naszej wersji i usługach. Dzięki setkom tysięcy opracowanych w tym modelu jesteśmy przekonani, że korzyści netto będą bardzo pozytywne, a przy użyciu miliardów tych Szkody będą zanegowane Technologia”.

Więcej informacji można znaleźć na Stabilny spread na GitHub. W pliku można znaleźć wiele przykładów możliwości tworzenia obrazu stabilnej dyfuzji Subreddit o stabilnym rozkładzie. idź tutaj po Subskrypcja wersji beta stabilnej dyfuzji.

Uwaga: linki do sklepów internetowych w artykułach można nazwać linkami partnerskimi. Jeśli kupujesz przez ten link, MIXED otrzymuje prowizję od dostawcy. Dla Ciebie cena się nie zmienia.

Randolph Howe

„Zła entuzjasta podróży. Irytująco skromny ćpun internetu. Nieprzepraszający alkoholiczek”.

Open source DALL-E „Open Diffusion” jest już dostępny na stronie internetowej

Konkurent open source DALL-E od OpenAI działa na twojej karcie graficznej

Finansowany konkurent stabilności AI za darmo DALL-E 2

Stabilne wdrożenie to nauczyciel open source

Stabilny spread: Puszka Pandory i odsetki netto

Randolph Howe

Rekomendowane artykuły

Ubisoft zamyka usługę online dla 10 starszych gier

Dr Disrespect twierdzi, że Warzone na konsoli jest „tak, że możesz z łatwością zamknąć oczy”

Spacer poklatkowy ukazuje ciężką pracę astronauty

Dodaj komentarz Anuluj pisanie odpowiedzi