どくとりん

@docto_rin

Medical Student (B5) at Nagoya Univ. | Part-time Engineer @PreferredNetJP

Joined July 2024

78Posts 93Followers 54Following

どくとりん

@docto_rin

Nov 4

Our new preprint is out on arXiv! We built MedRECT, a medical reasoning benchmark to study how LLMs detect, localize, and correct errors in clinical texts. Paper: arxiv.org/abs/2511.00421 Code: github.com/pfnet-research…

docto_rin's tweet card. Contribute to pfnet-research/medrect development by creating an account on GitHub.

GitHub - pfnet-research/medrect

Source: github.com

どくとりん

@docto_rin

Oct 23

"Reinforced"

Andrej Karpathy

@karpathy

Oct 22

This code is extremely dangerous. Here, I improved it.

どくとりん

@docto_rin

Oct 4

コンピュータ科学の本を10冊持って山に篭りたい

どくとりん

@docto_rin

Sep 19

Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents Stanfordより論文のコードと手順をMCPサーバーとしてtool callableにし、Claude Codeなどを用いて対話しながら実験再現や応用が可能に AlphaGenome、Scanpy、TISSUEなどがtoolとして搭載 arxiv.org/abs/2509.06917

どくとりん

@docto_rin

Sep 8

MedResearcher-R1 医療特化 Deep Research。 1. PubMedから、希少疾患も重視した知識グラフを構築 2. 臨床権威性と鑑別診断を両方加味した検索エンジン 3. SFT+RLで堅牢な医療推論能力を獲得 MedBrowseCompでo3 Deep Researchを倒してSOTA。一般タスクでも競争力のある成績。 arxiv.org/abs/2508.14880

どくとりん

@docto_rin

Sep 8

コード実行型エージェントのためのRL 可変時間行動に対する時間重み付き勾配＋進捗ログへの部分報酬により、勾配更新が速い方法の過剰評価を防ぎ、軽微な失敗も適切に評価。 Qwen2.5-3Bに適用し、Claude-3.5-Sonnet + agent scaffoldsに対しKaggleの12課題で平均+22%。 arxiv.org/abs/2509.01684

どくとりん

@docto_rin

Sep 7

論文草稿を書き上げたゾ〜

どくとりん

@docto_rin

Sep 2

pre-eclampsia の和訳は昔は子癇前症を当てていたけど、最近では妊娠高血圧腎症だよという話を産科の授業で聞きました google翻訳、DeepL、gpt-5-thinking、gemini-2.5-proに和訳させてみたらいずれも子癇前症と答えててなるほどなぁとなりました。医学用語の翻訳は難しい

どくとりん

@docto_rin

Aug 28

時代は Daniel Han なんよ

Daniel Han

@danielhanchen

Aug 28

GPT-OSS bug fixes + Flex Attention support is here! 1. Fixed float16 infinite losses (>65504 overflows) 2. SWA=128 Flex default uses 129 tokens (extra 1) 3. Fixed MXFP4 inference swiglu_limit=7.0 not set 4. Sink token moved to index 0 5. FA3 doesn't have attn sink dX Details:…

danielhanchen's tweet image. GPT-OSS bug fixes + Flex Attention support is here!

1. Fixed float16 infinite losses (&gt;65504 overflows)
2. SWA=128 Flex default uses 129 tokens (extra 1)
3. Fixed MXFP4 inference swiglu_limit=7.0 not set
4. Sink token moved to index 0
5. FA3 doesn't have attn sink dX

Details:…

どくとりん

@docto_rin

Aug 28

- 元の8倍以上のコンテキスト長でも単一GPU（80GB VRAM）で学習可能に - モデルロード時、expertをmxfp4のまま保持可能に - 学習後、mxfp4をon demand dequantizationしながらlora adapterとマージし、bf16でexport可能に - bf16未対応GPU上で損失が発散するバグを修正やっとインフラ整備されてきた

Unsloth AI

@UnslothAI

Aug 28

OpenAI gpt-oss with ultra long context is here!🚀 Introducing Unsloth Flex Attention which enables 61K context for gpt-oss bf16 training on a 80GB GPU. Unsloth achieves 8×longer context, 50% less VRAM & 1.5×faster training vs. all implementations. 🔗docs.unsloth.ai/basics/long-co…

UnslothAI's tweet image. OpenAI gpt-oss with ultra long context is here!🚀

Introducing Unsloth Flex Attention which enables 61K context for gpt-oss bf16 training on a 80GB GPU.

Unsloth achieves 8×longer context, 50% less VRAM &amp; 1.5×faster training vs. all implementations.

🔗docs.unsloth.ai/basics/long-co…

どくとりん

@docto_rin

Jun 12

このたび7月から、Preferred Networks (@PreferredNetJP) の医療用 LLM チームでパートタイムエンジニアとして働かせていただくことになりました！医学生としての視点も活かしながら、医療分野における AI 技術の発展に貢献できるよう、精一杯頑張ります。どうぞよろしくお願いいたします！

どくとりん

@docto_rin

Jun 11

Microsoftと中国のチームが提唱する新手法「Reinforcement Pre-Training (RPT)」。従来の「次トークン予測」を、報酬付きの「次トークン推論」として再定義する試み。アライメント用の強化学習（GRPO）を事前学習に導入し、モデルの根源的な推論能力向上を達成。論文： arxiv.org/abs/2506.08007

どくとりん

@docto_rin

Jun 7

【入門】フローマッチングのエッセンスzenn.dev/doctorin/artic… 前回投稿した「【入門】拡散モデルのエッセンス」に引き続き、フローマッチングの数理をまとめました。備忘録

【入門】フローマッチングのエッセンス

Source: zenn.dev

どくとりん

@docto_rin

Jun 3

arxiv.org/abs/2506.00711 画像 (1D/2D/3D)・時系列信号 (ECG)・テキストを統合する初のオープン臨床基盤モデル。 Domain-AwareなGRPOでデータ不均衡を緩和し、ドメイン希少性や難易度に応じて報酬を調整。診断性能（平均F1で43%向上）と解釈性（顕著領域IoUの精度はo4-miniに匹敵）を大幅に改善した。

どくとりん reposted

Bo Wang

@BoWang87

Jun 2

How can we make genomic foundation models actually useful to biology?! Teach them to REASON!! 🧬 Excited to share BioReason - the first model to successfully integrate DNA foundation models (eg, Evo 2) with LLMs (eg, Qwen3) for biological reasoning! 🔬 What we built: • Novel…