llama 8B模型靠15TB的data量效果超过GPT3.5，可以宣布端侧AI的时代毫无悬念的要到来了明显比我想象的要快得多不由得想起了那句话，模型的行为可能并非由架构，超参数或者优化器决定，更多取决于数据集，其他一切不过是将计算资源高效用于逼近数据集的一种手段罢了 , page 9

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

2621 位用户此时在线

24小时点击排行 Top 10：

12月3日(发布) 一男子模仿中国外交官答非所问的视频，在社交平台传播，目前抖音正陆续删除该视频。网友回复：“我怎么听出了新闻发布会的感觉”

12月3日，广东。一水果摊主正在带孩子，发现城管后立刻收拾摆放在门外的水果。城管见状快步径直走向摊位，将门外的水果搬上车带走，整套动作行云流水。

12月3日(发布) 河南郑州。女子发视频称，当都交警执法咄咄逼人，把丈夫逼到从立交桥上跳下来致其死亡。家人撕心裂肺的哭嚎着，不断拍打警察并质问道：你们咱把他弄死的！而交警低着头，沉默不语。

London is no longer a safe place. We all know very well why.

《00后被背刺的一天》

突发新闻：令人毛骨悚然的监控录像显示，刺客在纽约处决了美国🇺🇸联合健康保险公司首席执行官布莱恩·汤普森

被中国全网封杀，《工作都上哪去了》

12月3日，广东深圳。女子发视频称，梅沙幼儿园每天让孩子们在球场挥舞大刀，灌输仇恨教育。女子呵斥老师：这是在灌输仇恨教育，要教他们爱，孩子这么小就教他们杀戮，但校内的工作人员对女子的话置之不理。

12月3日(发布) 一老太太回忆往事：在当时，你骂孙中山和蒋介石，都可以，不存在你骂了谁，谁就整你。网友回复：“那个时代才会出鲁迅，现在你试试看，没人敢写”

川普早就戳穿了香港“一国两制”的谎言，香港已经沦为中国一个普通城市，还有澳门，现在连遮羞布都不要了。

12月4日，江苏南京。大爷在地铁上叫醒女生让座，女生让座后大爷仍不依不饶：“这个位置必须得让，没家教白上学了” 其他乘客帮女生说话也被大爷恐吓：让公安局查你，知道我是干什么的吗？说出来吓死你！

要我说，在网上真能学到奇奇怪怪的东西 #生活小妙招

俄羅斯士兵在死去戰友面前炫技（地面黑色裹屍袋）

如有可能还是试着探寻生命的意义 🙏

美国政府开始对中国共产党追究冠状病毒的责任了！

著名作家琼瑶近日在家中选择以自己的方式与世界告别。这是她最后的视频，遗言内容均在琼瑶离世前录制的视频中，她平静地表达了自己的心声：“生命中有太多无法言说的痛苦，我希望我的离开能让大家理解，每个人都有自己的选择。感谢我的读者，是你们陪伴我走过这段旅程。我的作品就是我生念的延续。

12月4日，广东。金皇酒店拖欠工人工资，工人跳楼讨薪。 12月13日，陕西渭南。华通路桥公司拖欠工程款，工人们在政务服务中心向工作人员下跪。 12月1日，湖南株洲。龙泉路一村拆迁，网曝政府给出的拆迁补偿过低，引发村民抗议。 12月4日(发布) 湖北黄冈，上巴河镇农民工镇政府门口讨薪。

经济学家高善文演讲：2025年可能是一个重要转折点（全文＋视频） 1. 转型、周期性压力

12月4日，吉林。访民们在检察院外高喊检察长，希望检察长能出来为民作主伸冤。

这坏逼狡猾的很，亲华媚朝反美反日，他自己收受巨额贿赂为杀人的亲属脱罪还有性丑闻，就这么个货用一个2000刀的皮包钓鱼执法就折腾的尹锡悦生不如死，这次不知道又搞了什么鬼把尹锡悦逼到要发戒严令🙄他要上去了韩国有大麻烦🙄

12月3日(发布) 河南郑州。女子发视频称，当都交警执法咄咄逼人，把丈夫逼到从立交桥上跳下来致其死亡。家人撕心裂肺的哭嚎，不断拍打警察并质问道：你们咱把他弄死的！而交警则低着头，沉默不语。

12月4日，山西晋中。1979年出生的卜女士，08年获得工学硕士学位当时卜女士因未及时更换二代身份证，导致无法考博士。后来，她患上精神分裂症，家人到学校将她接回家 10年初，卜女士离家失踪，从此了无音讯近日，在志愿者帮助下，卜女士找到了家人，目前卜女士有一儿一女。家人打算卖房为其治疗

共产党真是太牛逼了是生怕这些人，不采取报复社会的行为是吧

12月5日凌晨，深圳宝安富源工业城附近发生塌方，目前造成13人失联。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

llama 8B模型靠15TB的data量效果超过GPT3.5，可以宣布端侧AI的时代毫无悬念的要到来了
明显比我想象的要快得多
不由得想起了那句话，模型的行为可能并非由架构，超参数或者优化器决定，更多取决于数据集，其他一切不过是将计算资源高效用于逼近数据集的一种手段罢了
IT技术
( twitter.com )

7个月前由 fin 提交

点击图片查看原图

1周内 1个月内 1年内全部时间

上一页
1
...
4
5
6
7
8
9
10
11
12
13
14
...
400
下一页

1

2

1

1

84% of American voters favor photo identification requirements at their voting place.
New data:
时政
( on.gallup.com)

1个月前 • Gallup • -- 点击 0 评论

2

2

1

1

这哥们把llama，whisper，TTS做到一起了。全部本地运行。
视频
( twitter.com)

1年前 • 雷尼尔 • -- 点击 • 下载视频 0 评论

00:02:19

3

2

1

1

《开源大模型食用指南》基于 Linux 环境快速部署开源大模型，更适合中国宝宝的部署教程
IT技术
( github.com)

8个月前 • Geek • -- 点击 0 评论

4

2

1

1

剧情连上了！
GPT3.5 的 FT 数据，会过一遍上次说的 GPT4 为核心的内容审核模型，保证 FT 后的模型的安全性。
IT技术
( twitter.com)

1年前 • orange.ai • -- 点击 0 评论

5

2

1

1

【GPT-4震惊四座，中国创业者激战“小模型”】当下，用小模型打磨算法的利刃，为大模型的研发做好技术储备，或许是中国创业者在未来实现弯道超车的一条通路。
大陆资讯
( 36kr.com)

1年前 • 猩猩点灯 • -- 点击 0 评论

6

2

1

1

唐突公布新模型
推特中文圈
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

7

2

1

1

大模型狂奔300天
大陆资讯
( www.jiemian.com)

1年前 • 拉拉么 • -- 点击 0 评论

8

2

1

1

新型教学模式(*￣rǒ￣)
大陆资讯
( weibo.com)

8个月前 • 道知不 • -- 点击 0 评论

9

2

1

1

这是充气模型吧
大陆资讯
( m.weibo.cn)

10个月前 • 拉拉么 • -- 点击 0 评论

10

2

1

1

现在大家可能急需了解llm大模型的最新排行和价格，我做了一个表。
你最常用的模型是哪个？
时政
( twitter.com)

29天前 • Tony出海号 • -- 点击 0 评论

11

2

1

1

一些16-19世纪之间的骨制或者象牙造型的女性解剖模型。安全生育任何时候都是人们关注的话题，女性解剖小模型远远要比男性模型常见，而且一般体内都有胎儿，多作为助产士培训使用。
大陆资讯

1年前 • 粉身碎奶掌 • -- 点击 0 评论

12

2

1

1

MosaicML发布超大型AI模型MPT-30B，训练成本颠覆行业

AI创业公司MosaicML近日发布了一款拥有3000亿参数的语言模型MPT-30B。令人瞩目的是，这款模型的训练成本只有70万美元，远远低于其竞争对手GPT-…
IT技术
( twitter.com)

1年前 • GPTDAOCN • -- 点击 0 评论

13

2

1

1

Nvidia推出了Code Llama在线体验地址：

测试了下，让它说中文就是不说，但是你说中文他能听懂并用英文回答😕

最重要的是输出速度挺快，比GPT快起码3倍吧！代码能力你们自己测测吧！

Code Llama 是 Llama 2 的代码专用版本。它可以根据自然语言提示生成可以生成…
IT技术
( nvda.ws)

1年前 • 小互 • -- 点击 • 下载视频 0 评论

00:00:08

14

2

1

1

最近提出的Falcon-40B模型在与其他开源大型语言模型（LLMs）的比较中达到了前所未有的性能水平，甚至可以与付费模型相媲美。以下是Falcon-40B成功的关键因素：

1. 更多的网络数据：许多LLMs在经过筛选的文本语…
IT技术
( twitter.com)

1年前 • GPTDAOCN • -- 点击 0 评论

15

2

1

1

在线编程平台Replit近期发布了一篇关于《如何训练你自己的大型语言模型》的博客文章，分享了他们在训练自家编程大型语言模型（LLM）过程中的经验和教训。

他们把整个过程分成了三个阶段：数据管道、模型训练、推理

他们的主要数据来…
推特中文圈
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

16

2

1

1

哇！！发现falcon40B也能商用了。这个牛逼！ 11个小时前，TII将license改成了apache 2.0。而且这个模型在排行榜中非常靠前。这么真是breaking good news。…
IT技术
( twitter.com)

1年前 • 雷尼尔 • -- 点击 0 评论

17

6

5

5

【特殊造形师万凛与她的女鬼们】“特殊造形师”（特殊造形師）在日文中常指那些制作逼真模型的雕塑家或道具师，博物馆、鬼屋中陈列的生物、鬼怪模型就出自其手。在以前 CGI 技术不发达的时候，电影中的生物奇怪或外星怪物都得靠特殊造形师来完成。
大陆资讯
( www.gcores.com)

4年前 • 孤独寂寞冷 • -- 点击 0 评论

18

3

2

2

巴别塔，是圣经故事里人类联合起来兴建希望能通往天堂的高塔；为了阻止人类的计划，上帝让人类说不同的语言，使人类相互之间不能沟通，自此各散东西。
如今GPT3一个模型靠海量输入就已经通晓各国语言。
当一个美国公司的模型说的中文远远超过…
推特中文圈
( twitter.com)

1年前 • orange.ai • -- 点击 0 评论

19

4

3

3

来自OpenAI的Safety团队的负责人Lilian Weng发表的新文章：《Adversarial Attacks on LLMs | 大语言模型遭受的对抗性攻击》
现在随着大语言模型的流行，针对大语言模型的攻击也日渐增多。她在文章中将针对大语言模型的攻击分成了5类：
1. Token 操纵
微调输入文本的少量…
IT技术
( twitter.com)

1年前 • 宝玉 • -- 点击 0 评论

20

2

1

1

尹烨谈openAI 的sora模型！你认同吗？
时政
( twitter.com)

9个月前 • 蔡子博士Chris • -- 点击 • 下载视频 0 评论

00:07:54

21

5

4

4

今天来了一个租模特的，居然爆粗口，靠！
图片
( ww4.sinaimg.cn)

11年前 • 风吹大奶两边倒 • -- 点击 1 评论

22

2

1

1

这个 NFT 钓鱼，如果你的钱包提示是“未知方法”，那么注意看下具体的 Data，如果 Data 的十六进制以 0xa22cb465 开头，那么这就是有风险的，因为 0xa22cb465 实际上就是 setApprovalForA…
币圈
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

23

2

1

1

最新支持中文的开源模型个人向推荐（不同参数规模的）。
时政
( twitter.com)

4个月前 • 九原客 • -- 点击 0 评论

24

2

1

1

手把手教你训练你自己的AI歌手，最重要的一步来了。如何训练歌手的模型。这一步主要由两部分组成数据处理和模型训练。
这个林俊杰是我自己训练的4800步的模型，对比一下上一篇教程里的孙燕姿模型有两万多步，数据的质量也很重要。
感谢各位…
IT技术
( twitter.com)

1年前 • 歸藏 • -- 点击 0 评论

25

2

1

1

芒格喜欢提「思维模型」这个词。现代医学领域的思维模型有什么呢？一个必须是科学思维，或者叫科学逻辑，另外一个如果算的话，则是「大样本双盲随机对照试验」模型。

至于传统医学有没有「思维模型」呢？想来想去，也只能是「博大精深」了。
IT技术
( twitter.com)

1年前 • Fenng • -- 点击 0 评论

上一页
1
...
4
5
6
7
8
9
10
11
12
13
14
...
400
下一页

0.10051 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: [email protected]

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特