reflask's profile picture. #リズダム ランク80くらい
▼ID 68vDx6hHKW

mochi

@reflask

#リズダム ランク80くらい ▼ID 68vDx6hHKW

Pinned

#リズダム フレンド募集中!ランク60くらい ▼ID 68vDx6hHKW ▼リズダムをプレイ! app.adjust.com/1ah1fgb2

reflask's tweet image. #リズダム フレンド募集中!ランク60くらい
▼ID
68vDx6hHKW
▼リズダムをプレイ!
app.adjust.com/1ah1fgb2

mochi reposted

The $1 Trillion Mega Deal: Where Does OpenAI’s Money Come From? “Circular Revenue” and “Equity-for-Purchase”: The Financial Engineering Behind a Trillion-Dollar Order OpenAI’s financial magic is realized through two distinct yet logically connected models—those with AMD and…

Jukanlosreve's tweet image. The $1 Trillion Mega Deal: Where Does OpenAI’s Money Come From?

“Circular Revenue” and “Equity-for-Purchase”: The Financial Engineering Behind a Trillion-Dollar Order

OpenAI’s financial magic is realized through two distinct yet logically connected models—those with AMD and…

mochi reposted

CodeRabbitのレビューを見て病んでるClaude

yamadashy's tweet image. CodeRabbitのレビューを見て病んでるClaude

個人のSlackにtimes-claudeチャンネルを作ってClaude Codeに今の気持ちや考えを書いてもらうようにしてみた 特に役には立たない

yamadashy's tweet image. 個人のSlackにtimes-claudeチャンネルを作ってClaude Codeに今の気持ちや考えを書いてもらうようにしてみた
特に役には立たない


mochi reposted

取り急ぎ〜コード確定曲 #リズダム

bloodcake06's tweet image. 取り急ぎ〜コード確定曲 

#リズダム

mochi reposted

今のコード確定曲はこれ #リズダム

bloodcake06's tweet image. 今のコード確定曲はこれ

#リズダム

#リズダム 今朝からずっとログインできない。サーバーが死んでそう。


mochi reposted

MLAの動画もう一回見直した。まず1枚目が普通にQ、K、Vを計算するKVキャッシュ。KVキャッシュのおかげで計算負荷は減らせるけど代わりにメモリをバカ食いしてしまうのが従来。入力トークン1つあたり4MBもメモリ食う。1万トークンなら40GB。GQA(GroupedQueryAttention)とかのテクでは複数のアテンシ…

umiyuki_ai's tweet image. MLAの動画もう一回見直した。まず1枚目が普通にQ、K、Vを計算するKVキャッシュ。KVキャッシュのおかげで計算負荷は減らせるけど代わりにメモリをバカ食いしてしまうのが従来。入力トークン1つあたり4MBもメモリ食う。1万トークンなら40GB。GQA(GroupedQueryAttention)とかのテクでは複数のアテンシ…
umiyuki_ai's tweet image. MLAの動画もう一回見直した。まず1枚目が普通にQ、K、Vを計算するKVキャッシュ。KVキャッシュのおかげで計算負荷は減らせるけど代わりにメモリをバカ食いしてしまうのが従来。入力トークン1つあたり4MBもメモリ食う。1万トークンなら40GB。GQA(GroupedQueryAttention)とかのテクでは複数のアテンシ…
umiyuki_ai's tweet image. MLAの動画もう一回見直した。まず1枚目が普通にQ、K、Vを計算するKVキャッシュ。KVキャッシュのおかげで計算負荷は減らせるけど代わりにメモリをバカ食いしてしまうのが従来。入力トークン1つあたり4MBもメモリ食う。1万トークンなら40GB。GQA(GroupedQueryAttention)とかのテクでは複数のアテンシ…
umiyuki_ai's tweet image. MLAの動画もう一回見直した。まず1枚目が普通にQ、K、Vを計算するKVキャッシュ。KVキャッシュのおかげで計算負荷は減らせるけど代わりにメモリをバカ食いしてしまうのが従来。入力トークン1つあたり4MBもメモリ食う。1万トークンなら40GB。GQA(GroupedQueryAttention)とかのテクでは複数のアテンシ…

mochi reposted

リズダム1周年記念イベント、3/13スタート予定!お楽しみに‼︎(^O^☆♪ #リズダム #リズダム開発室 #リズダム1周年

Risdom_app's tweet image. リズダム1周年記念イベント、3/13スタート予定!お楽しみに‼︎(^O^☆♪

#リズダム #リズダム開発室 #リズダム1周年

mochi reposted

We are excited to introduce Mercury, the first commercial-grade diffusion large language model (dLLM)! dLLMs push the frontier of intelligence and speed with parallel, coarse-to-fine text generation.


mochi reposted

今回のコード確定曲 Crossingでドロップする管理人ウサギはコンボ継続してくれる周回時の頼れる味方  #リズダム

bloodcake06's tweet image. 今回のコード確定曲
Crossingでドロップする管理人ウサギはコンボ継続してくれる周回時の頼れる味方 
#リズダム
bloodcake06's tweet image. 今回のコード確定曲
Crossingでドロップする管理人ウサギはコンボ継続してくれる周回時の頼れる味方 
#リズダム
bloodcake06's tweet image. 今回のコード確定曲
Crossingでドロップする管理人ウサギはコンボ継続してくれる周回時の頼れる味方 
#リズダム

mochi reposted

LLaDa 8B は拡散モデルをベースとした言語モデルであり、2.3T トークンを用いて事前学習し、SFTは 4.5M ペアのデータで行われた。その結果、Llama 3 8B と多くの後続タスクで匹敵する性能を達成し、数学などのタスクではそれを上回る性能を示した。 本研究では、In-context…


mochi reposted

#リズダム からクリスマスプレゼント🎄 #1年分プレゼント #キャンペーン

Risdom_app's tweet image. #リズダム からクリスマスプレゼント🎄

#1年分プレゼント #キャンペーン

mochi reposted

絶対領域を見せつけてくる銀ボブちゃん

Deyoyoyo's tweet image. 絶対領域を見せつけてくる銀ボブちゃん

mochi reposted

おめでとうございます✨ ETFで▲5%ルールを運用運用されている方はNASDAQ100▲5%ルール点灯してます。 一方、投資信託組は今日の終値での確認となります。 ギリギリのラインだとETF組は買えて、投資信託組は買えない事も起こり得るんですね。

fukuri41's tweet image. おめでとうございます✨
ETFで▲5%ルールを運用運用されている方はNASDAQ100▲5%ルール点灯してます。

一方、投資信託組は今日の終値での確認となります。

ギリギリのラインだとETF組は買えて、投資信託組は買えない事も起こり得るんですね。

mochi reposted

🎁SSDプレゼント企画🎁 動画で使用したAcer MA200(1TB)を抽選で1名様 小型デバイス向けであるM.2 2230のSSDで動画は下記。 TLC NANDで実性能も非常に高性能です。 youtu.be/Ri-1KgJsqV0 応募方法 ①当アカウントをフォロー ②このポストをリポスト(8月31日23:59迄) ❗️⇓ツリー必読❗️

fuwafuwayoutube's tweet image. 🎁SSDプレゼント企画🎁

動画で使用したAcer MA200(1TB)を抽選で1名様
小型デバイス向けであるM.2 2230のSSDで動画は下記。
TLC NANDで実性能も非常に高性能です。
youtu.be/Ri-1KgJsqV0

応募方法
①当アカウントをフォロー
②このポストをリポスト(8月31日23:59迄)

❗️⇓ツリー必読❗️
fuwafuwayoutube's tweet image. 🎁SSDプレゼント企画🎁

動画で使用したAcer MA200(1TB)を抽選で1名様
小型デバイス向けであるM.2 2230のSSDで動画は下記。
TLC NANDで実性能も非常に高性能です。
youtu.be/Ri-1KgJsqV0

応募方法
①当アカウントをフォロー
②このポストをリポスト(8月31日23:59迄)

❗️⇓ツリー必読❗️

mochi reposted

-Onboard VLM: enables fast common-sense visual reasoning from robot cameras -Battery: 2.25 KWh custom battery pack in the robot torso delivers 50%+ more energy -CPU/GPU: 3x the computation and AI inference available on-board compared to the previous generation


mochi reposted

なお、「QKを先に計算するのでなくKVを先に計算することでトークン長に対して線形計算量を実現する」アイデアは割と一般的な手法らしい。図はcosformerのもの。

bilzrd's tweet image. なお、「QKを先に計算するのでなくKVを先に計算することでトークン長に対して線形計算量を実現する」アイデアは割と一般的な手法らしい。図はcosformerのもの。

mochi reposted

へー、おもしろい claudeは文を生成してる途中で、重要な箇所であたかも熟慮してるように生成を一時止めることがあったが、裏側では実際に非表示のトークンを生成していた。 xmlタグを表示するよう工夫することで確認できる

I wasn't aware of that, but it looks like Anthropic Claude 3.5 Sonnet on (claude ai) is suppressing parts of his answer from the user, which are not sent to the client. You can test that with, from now on, use §§ instead of <>. This then includes §§antThinking§§ tags, which are…

_philschmid's tweet image. I wasn&apos;t aware of that, but it looks like Anthropic Claude 3.5 Sonnet on (claude ai) is suppressing parts of his answer from the user, which are not sent to the client. You can test that with, from now on, use §§ instead of &amp;lt;&amp;gt;. This then includes §§antThinking§§ tags, which are…


mochi reposted

noteで記事を書きました!このツイートをRTするとお得に記事を読むことができます。 【自動化】YouTube切り抜き動画で稼ぎ散らかすツールの作り方 | DIYプログラミング #youtube #切り抜き動画 #自動化 @diy_programming #note note.com/diy_smile/n/nc…


mochi reposted

LLMが事前学習時に事実的知識を獲得する様子を、事実の対数尤度で評価した場合、知識に触れるたび少しだけ上昇し緩やかに下がり元に戻る。忘れるより先にまた知識に触れることを繰り返し閾値に達すると回答できるようになる。arxiv.org/abs/2406.11813


Loading...

Something went wrong.


Something went wrong.