Changbeihai's profile picture. 在那之前要多想

章北海

@Changbeihai

在那之前要多想

世界上最强大的AI,就其最擅长的代码能力,其实也都处于初级阶段,处理easy问题还行,到Hard模式,一次成功率就约等于0 了。代码能力是最简单的能力,最容易验证的能力,你用它干别的,尤其是你自己都不熟悉的领域,那只能被忽悠的团团转了[Doge]

Changbeihai's tweet image. 世界上最强大的AI,就其最擅长的代码能力,其实也都处于初级阶段,处理easy问题还行,到Hard模式,一次成功率就约等于0 了。代码能力是最简单的能力,最容易验证的能力,你用它干别的,尤其是你自己都不熟悉的领域,那只能被忽悠的团团转了[Doge]
Changbeihai's tweet image. 世界上最强大的AI,就其最擅长的代码能力,其实也都处于初级阶段,处理easy问题还行,到Hard模式,一次成功率就约等于0 了。代码能力是最简单的能力,最容易验证的能力,你用它干别的,尤其是你自己都不熟悉的领域,那只能被忽悠的团团转了[Doge]
Changbeihai's tweet image. 世界上最强大的AI,就其最擅长的代码能力,其实也都处于初级阶段,处理easy问题还行,到Hard模式,一次成功率就约等于0 了。代码能力是最简单的能力,最容易验证的能力,你用它干别的,尤其是你自己都不熟悉的领域,那只能被忽悠的团团转了[Doge]

都说小红书写长文功能上线,有流量,我也试试

Changbeihai's tweet image. 都说小红书写长文功能上线,有流量,我也试试
Changbeihai's tweet image. 都说小红书写长文功能上线,有流量,我也试试

DeepSeek 最新开源OCR模型,实测,不如百度 mp.weixin.qq.com/s/lWATuJlctkTH…

Changbeihai's tweet image. DeepSeek 最新开源OCR模型,实测,不如百度
mp.weixin.qq.com/s/lWATuJlctkTH…
Changbeihai's tweet image. DeepSeek 最新开源OCR模型,实测,不如百度
mp.weixin.qq.com/s/lWATuJlctkTH…
Changbeihai's tweet image. DeepSeek 最新开源OCR模型,实测,不如百度
mp.weixin.qq.com/s/lWATuJlctkTH…

你就是写技术也一定要爱国❤️

Changbeihai's tweet image. 你就是写技术也一定要爱国❤️

arXiv不但有预印本论文📑 还有预印的书📖 非常精美,质量很高🏢 👈左边这本讲神经网络,👉右边深度学习

Changbeihai's tweet image. arXiv不但有预印本论文📑
还有预印的书📖
非常精美,质量很高🏢
👈左边这本讲神经网络,👉右边深度学习
Changbeihai's tweet image. arXiv不但有预印本论文📑
还有预印的书📖
非常精美,质量很高🏢
👈左边这本讲神经网络,👉右边深度学习

Qwen3:思深,行速 Google NotebookLM:巧思胜苦干

Changbeihai's tweet image. Qwen3:思深,行速
Google NotebookLM:巧思胜苦干
Changbeihai's tweet image. Qwen3:思深,行速
Google NotebookLM:巧思胜苦干

美国人都受不鸟OpenAI的价格了

US model vs. China model

Yuchenj_UW's tweet image. US model vs. China model


三个大模型共读《背影》,阅读理解后设计知识卡片,实测DeepSeek、Qwen2.5-Max、 Claude,考察三个模型长文本输入,文字总结能力 阿里,极简风格,也算完成了 DeepSeek,不知所云,第四个背影还出格了 最后是令人震惊的 Claude 3.7 他找到了原文,针对原文做了深意理解 然后还完美呈现出来了

Changbeihai's tweet image. 三个大模型共读《背影》,阅读理解后设计知识卡片,实测DeepSeek、Qwen2.5-Max、 Claude,考察三个模型长文本输入,文字总结能力
阿里,极简风格,也算完成了
DeepSeek,不知所云,第四个背影还出格了
最后是令人震惊的 Claude 3.7
他找到了原文,针对原文做了深意理解
然后还完美呈现出来了
Changbeihai's tweet image. 三个大模型共读《背影》,阅读理解后设计知识卡片,实测DeepSeek、Qwen2.5-Max、 Claude,考察三个模型长文本输入,文字总结能力
阿里,极简风格,也算完成了
DeepSeek,不知所云,第四个背影还出格了
最后是令人震惊的 Claude 3.7
他找到了原文,针对原文做了深意理解
然后还完美呈现出来了
Changbeihai's tweet image. 三个大模型共读《背影》,阅读理解后设计知识卡片,实测DeepSeek、Qwen2.5-Max、 Claude,考察三个模型长文本输入,文字总结能力
阿里,极简风格,也算完成了
DeepSeek,不知所云,第四个背影还出格了
最后是令人震惊的 Claude 3.7
他找到了原文,针对原文做了深意理解
然后还完美呈现出来了

昨晚的GPT-4.5 好像有点泛善可陈啊 10倍的成本,5%的提升 写代码不如Claude 3.7 部分benchmark甚至不如deepseek v3 但价格却是DeepSeek v3 280/150倍 技术灵魂Ilya Sutskever出走之后 OpenAI只能吃老本了 就像现在的苹果🍎

Changbeihai's tweet image. 昨晚的GPT-4.5 好像有点泛善可陈啊
10倍的成本,5%的提升
写代码不如Claude 3.7
部分benchmark甚至不如deepseek v3
但价格却是DeepSeek v3 280/150倍
技术灵魂Ilya Sutskever出走之后
OpenAI只能吃老本了
就像现在的苹果🍎

大公司没有信仰 梁老板本人很有信仰,他相信 AGI一定会达成,而且是有限的时间内可以达成,这个 AGI一定是稀疏的,这份信仰传播给每一个下属。

Changbeihai's tweet image. 大公司没有信仰
梁老板本人很有信仰,他相信 AGI一定会达成,而且是有限的时间内可以达成,这个 AGI一定是稀疏的,这份信仰传播给每一个下属。

冷知识: 1、想让大模型犯错都很难,尤其是错别字,Qwen2.5-72B也不行 2、跑Deepseek-R1-70B需要差不多50GB显存

Changbeihai's tweet image. 冷知识:
1、想让大模型犯错都很难,尤其是错别字,Qwen2.5-72B也不行
2、跑Deepseek-R1-70B需要差不多50GB显存
Changbeihai's tweet image. 冷知识:
1、想让大模型犯错都很难,尤其是错别字,Qwen2.5-72B也不行
2、跑Deepseek-R1-70B需要差不多50GB显存

我们要写两份年终总结 一份应付上面 一份内部讨论


用不完 完全用不完 现在大模型api太便宜了。。。

Changbeihai's tweet image. 用不完
完全用不完
现在大模型api太便宜了。。。
Changbeihai's tweet image. 用不完
完全用不完
现在大模型api太便宜了。。。
Changbeihai's tweet image. 用不完
完全用不完
现在大模型api太便宜了。。。

公司叫Codeium 产品叫Windsurf 功能叫Cascade。。。。。。


小众到只有我一个人需要的脚本:Obsidian Web Clipper采集的Markdown,通过 S3 API 批量上传图片到Cloudflare R2后替换 Markdown 中的图片链接

Changbeihai's tweet image. 小众到只有我一个人需要的脚本:Obsidian Web Clipper采集的Markdown,通过 S3 API 批量上传图片到Cloudflare R2后替换 Markdown 中的图片链接

检验一件事儿是否重要的方法:拖延 拖着拖着,事儿消失了,那就没事儿了 这是我多年工作得到的经验 比如业务有个需求特别紧急 借口忙拖上3天,再问,不急了 一周后,需求不做了[GoForIt]


一个极小众需求——全屏下浏览器Tab看时间

Changbeihai's tweet image. 一个极小众需求——全屏下浏览器Tab看时间
Changbeihai's tweet image. 一个极小众需求——全屏下浏览器Tab看时间

苹果🍎真是恶意满满 Windows共享文件给Mac, 图标放大之后,居然是Windows经典蓝屏。。。

Changbeihai's tweet image. 苹果🍎真是恶意满满
Windows共享文件给Mac,
图标放大之后,居然是Windows经典蓝屏。。。
Changbeihai's tweet image. 苹果🍎真是恶意满满
Windows共享文件给Mac,
图标放大之后,居然是Windows经典蓝屏。。。

章北海 repostou

光讨论不行啊,我上午看到后发现没人动手,就火速录制视频发布到B站了:bilibili.com/video/BV1YbBvY…


何同学的团队连git都不会用吗? 怎么还download ZIP?/::|

Changbeihai's tweet image. 何同学的团队连git都不会用吗?
怎么还download ZIP?/::|

Loading...

Something went wrong.


Something went wrong.