Transluce

@TransluceAI

Open and scalable technology for understanding AI systems.

transluce.org

Joined October 2024

139Posts 8KFollowers 15Following

Transluce reposted

Sayash Kapoor

Sep 12

Agent benchmarks lose *most* of their resolution because we throw out the logs and only look at accuracy. I’m very excited that HAL is incorporating @TransluceAI’s Docent to analyze agent logs in depth. Peter’s thread is a simple example of the type of analysis this enables,…

Peter Kirgis

Sep 12

OpenAI claims hallucinations persist because evaluations reward guessing and that GPT-5 is better calibrated. Do results from HAL support this conclusion? On AssistantBench, a general web search benchmark, GPT-5 has higher precision and lower guess rates than o3!

PKirgis's tweet image. OpenAI claims hallucinations persist because evaluations reward guessing and that GPT-5 is better calibrated. Do results from HAL support this conclusion? On AssistantBench, a general web search benchmark, GPT-5 has higher precision and lower guess rates than o3!

neil grigg

@GriggNeil

Nicholas Turner

@nicholasturner0

Emir Nur

@EmirNur0508

Pranit Kothari

@pranitkothari

Kai Fronsdal

@kaifronsdal

unruly abstractions

@unrulyabstract

Thomas Fel

@Napoolar

Tommy

@Shaughnessy119

≽(•ᴗ•)≼

@eepiestelfie

Giosuè Baggio

@giosuebaggio

The Bruhinator

@th3_bruhinator

Isha Puri @COLM

@ishapuri101

Victor

@Victor36198435

Gabe 🧬

@Gabogonzalez515

Prahitha Movva @COLM2025

@PrahithaM

jessicat

@jessi_cata

Jennifer

@jenniferzsun

Ziso

@EyasAyesh

Neel Jain @ COLM 2025

@neeljain1717

Ethan Shen

@ethnlshn

Synapsee

@1qQuantum53244

Michelle Fang

@michejafang

benjamin ar

@bjamin_ar

GrowthsystemAI

@GrowthsystemAi

Amritanshu

@Will_Hackspeare

Purvi Zaveri

@PurZave

Zachary Schlosser

@Zach_Schloss

sceleri

@sceleri_

Jess

@Jes_he_

Jaya Kambhampaty

@jkambhampaty

Darren Peng

@peng_darren7

Michael Carter

@michaelmxcarter

Karel D’Oosterlinck

@KarelDoostrlnck

Jacob Green

@greenjjacob

Kevin Kreger

@HealthyCode

Dilara Soylu

@dilarafsoylu

Daniel Meyer

@D4Ni92_

Jarrad Hope

@jarradhope_

Arsenio Bellingham

@l2_norm

Nick Garrett

@thepetersreview

Juan

@juan_cambeiro

Adam

@AdamTJPR

Odds

@OddsIsOnline

e

@e776675411527

sam

@samjwng

someone random

@serackerardy

Varoon Mathur

@VaroonMathur

snow stork

@snowstork

Elias Kempf

@elkmf

Mirlauk

@Mirlauk8493

nostalgebraist

@nostalgebraist

Cassidy Laidlaw

@cassidy_laidlaw

Zhengxuan Wu

@ZhengxuanZenWu

Aryaman Arora

@aryaman2020

caden

@kh4dien

Sam Klein📚🏛️

@metasj

Daniel Johnson

@_ddjohnson

Tiffany Tzeng

@tzeng_tiffany

vincent

@vvhuang_

Xiang Lisa Li

@XiangLisaLi2

Dami Choi

@damichoi95

Neil Chowdhury

@ChowdhuryNeil

Kevin Meng

@mengk20

Sarah Schwettmann

@cogconfluence

Jacob Steinhardt

@JacobSteinhardt

United States Trends

1. Auburn 45.3K posts
2. Brewers 64.2K posts
3. Georgia 67.3K posts
4. Cubs 55.6K posts
5. Kirby 23.9K posts
6. Utah 24.6K posts
7. Arizona 41.4K posts
8. #byucpl N/A
9. Gilligan 5,936 posts
10. #AcexRedbull 3,831 posts
11. #BYUFootball 1,007 posts
12. Michigan 62.5K posts
13. Hugh Freeze 3,233 posts
14. #Toonami 2,704 posts
15. Boots 50K posts
16. Amy Poehler 4,463 posts
17. Kyle Tucker 3,178 posts
18. Dissidia 5,771 posts
19. #GoDawgs 5,561 posts
20. Tina Fey 3,477 posts

Something went wrong.

Something went wrong.