Stable Diffusion公司发布首个大语言模型StableLM,已开源公测!

c52c88ce73de4f532583a441d3d34f37.png

文 | 智商掉了一地

20号凌晨,Stability AI 发布了一个新的开源语言模型—— StableLM,该公司曾开发了 Stable Diffusion 图像生成工具。这则新闻意味着它不再局限于图像与视频生成领域,将正式加入文本生成 AI 赛道。

StableLM 模型可以生成文本和代码,并将为一系列下游应用提供助力。下面的链接包含了 Stability AI 正在开发的 StableLM 系列语言模型,感兴趣的小伙伴可以在下面 Huggingface 链接中尝试与 70 亿参数的模型聊天体验~

9afdb87e0e3fe7a987c09fcdb39b79d0.png

GitHub 地址:
https://github.com/stability-AI/stableLM/

模型官网:
https://stability.ai/

Huggingface Chat 地址:
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat


StableLM

Stability AI 已经将 StableLM 发布在 GitHub 上托管,开发人员可以直接使用或经过微调后使用,同时还发布了用于研究的 RLHF-tuned 模型。StableLM 遵循着开源和对所有人开放的宗旨,将权力交还给开发者社区,目前 StableLM 仍处于 Alpha 阶段,只公布了 30 亿和 70 亿参数的模型,下一步将会推出 150 亿到 650 亿参数的更大参数模型。

deaa46d6782896adfa60eb7448722b24.png

据介绍,StableLM 是在一个基于 The Pile 建立的新实验数据集上训练的,但数据集规模比原来大三倍,含有 1.5 万亿个 Token 的内容。

Stability AI 用下面的对话展示了他们的大模型 StableLM 生成文本与代码的能力,对于英文的问答确实比较得心应手,这些问答都是用 70 亿个参数微调模型生成的:

ed219780df3fae097862fb511b7b0e70.png c0698b9443facb6ad3fdebe8121cdc09.png

而在与 StableLM 的对话体验中,小编还发现它可以用中文交流,能够基本理解我的语义(虽然细节还是有问题)。比较可惜的是,比起 ChatGPT 来说,还是有点距离。它懂点中文,但不多,聊着聊着就开始胡言乱语……

1109c0737beb55c375d593b00a885ab1.png 58a99c9b0161c1a537c82b3b43448dcd.png

Stability AI 仍强调了希望每个人都能够参与其设计语言模型,像 StableLM 这样的模型展示了致力于透明、易于访问和支持性的 AI 技术:

  • 透明性:开源模型能促进透明度、建立信任,并帮助研究人员开展可解释性技术工作,从而识别潜在风险并帮助开发保障措施。

  • 易用性:模型易于访问,开放且细粒度的访问机会能使大众研究和学术界能够发展解释性和安全技术,超越了闭源模型的可能性。

  • 支持性:旨在帮助用户提高生产率、释放创造力,并开启新的经济机遇。

最后,Stability AI 对于生成回答所存在的潜在问题提醒如下:

任何预训练的大型语言模型,在没有进一步微调和强化学习的情况下,其回复内容可能良莠不齐,包含有冒犯性的言论和观点。随着规模的扩大、更好的数据、社区反馈和优化,这种情况将有望得到改善

小结

不久之后,Stability AI 会发布完整的技术报告,同时未来也将启动 RLHF 计划,并与多个社区一起努力创建用于 AI Assistant 的开源数据集。随着 StableLM 模型套件的推出,Stability AI 也仍在继续推行让基础 AI 技术对所有人可用的宗旨,虽然曾因涉嫌图像侵权被众多艺术家投诉过,但在去年年底也收获了一笔融资,成为了 AI 内容生成领域的独角兽。

对于 AI 底层工具是否应该开源,一直以来存在着激烈的争论:

  • 有些人认为开源会降低模型的商业价值,使得开发者无法获得应有的回报;

  • 亦有一些人认为开源可以促进技术的发展和普及,并且更能确保其信任和透明度。

StableLM 的开源,向我们展示了 Stability AI 关于“AI by the people, for the people”的诚意。相比一些表现非常好但其黑盒运行令普通用户无从得知细节的模型,StableLM 的开源不仅有助于提升其透明度,也让更多人有机会在其基础上开发和创新

随着 AI 技术的不断发展,有越来越多的人开始希望这些技术能够真正地赋能大众,释放他们的创造力。而开源的 AI 技术恰有助于实现这一目标,因为它使得技术更容易被改进和扩展,同时也使得更多人能够共同参与到技术的开发和推广中。进一步让更多人能够从中受益,创造更多的价值。

e0e2ee7605bda21698f7fa247fe39033.png

卖萌屋作者:智商掉了一地

北理工计算机硕士在读,近期沉迷于跟 ChatGPT 唠嗑,对一切新颖的 NLP 应用充满好奇,正在努力成为兴趣广泛的斜杠青年~

作品推荐

  1. 我是粉红猪佩奇,我要把粉色吹风机写进 IJCAI 论文!

  2. AI取代人类,可以自动生成prompt了

  3. ICLR 2023 最高分论文被锤抄袭??

  4. AI讲话总爱“结巴”?这篇NeurIPS论文找到了病因,结巴率已接近人类!

  5. 如何提升大规模Transformer的训练效果?Primer给出答案

  6. Yoshua Bengio:我的一生

1a41c6810bfde51850300e811601af97.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群


http://www.niftyadmin.cn/n/258174.html

相关文章

Matlab绘图中的一些技能

目录 1、matlab坐标轴设置多种字体(复合字体) 2、matlab图片中title生成的标题转移至图像下端 3、指定对应格式和期望dpi的图像进行保存、以及不留白保存 4、设置字体字号(x、y轴,标题。全局字体等) 5、设置刻度值信息,只有左…

【利刃出鞘】链式思维利用ChatGPT,让其成为工作中的利剑?附带初学者扫盲SpringBoot

【利刃出鞘】链式思维利用ChatGPT,让其成为工作中的利剑 一、一点思考二、技术学习——链式思维2.1 springboot注册bean的几种方式?2.2 springboot Component 注册的原理?2.3 springboot引用注册的Bean原理?2.4 private final MyB…

(二)AIGC—Stable Diffusion(2)

越往后,加的噪声越多,逐渐递增 正常的话,类似RNN,前向传递,不利于模型训练。 如果直接从x0到xt最好,DPPM这篇论文就实现了这一目标 beta这一参数在扩散过程是已知的,前期设计好,从0…

excel数据分析比赛

基础 sql:百度网盘 请输入提取码 excel函数 <

无人机视频与GIS融合三维实景怎么实现?

无人机视频与GIS融合三维实景怎么实现?无人机三维GIS作为一项新兴的测绘重要手段&#xff0c;具有续航时间长、成本低、机动灵活等优点&#xff0c;为城市的规划建设带来极大便利。 那么此项技术有什么样的特点呢?下面智汇云舟就带大家一起来了解一下。 三维是将采集以及经运…

编程中最难的就是命名?这几招教你快速上手

作者&#xff1a;陈立(勤仁) 你可不能像给狗狗取名字那样给类、方法、变量命名。仅仅因为它很可爱或者听上去不错。 在写代码的时候&#xff0c;你要经常想着&#xff0c;那个最终维护你代码的人可能将是一个有暴力倾向的疯子&#xff0c;并且他还知道你住在哪里。 01 为什么…

Windows下如何查看某个端口被谁占用被杀死占用进程

开发时经常遇到端口被占用的情况&#xff0c;这个时候我们就需要找出被占用端口的程序&#xff0c;然后结束它&#xff0c;本文为大家介绍如何查找被占用的端口。 1、打开命令窗口(以管理员身份运行) 开始—->运行—->cmd&#xff0c;或者是 windowR 组合键&#xff0c;…

温度调制式差示扫描量热法(MTDSC)中的正弦波温度控制技术

摘要&#xff1a;在调制温度式差式扫描量热仪&#xff08;MTDSC&#xff09;中&#xff0c;关键技术之一是正弦波加热温度的实现&#xff0c;此技术是制约目前国内无法生产MTDSC量热仪的重要障碍&#xff0c;这主要是因为现有的PID温控技术根本无法实现不同幅值和频率正弦波这样…