Jeff Gao's picture

Jeff Gao

jeff-gao

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 hours ago

SwanVoice: Expressive Long-Form Zero-Shot Speech Synthesis for Both Monologue and Dialogue

upvoted a paper about 3 hours ago

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

upvoted a paper about 3 hours ago

APPO: Agentic Procedural Policy Optimization

View all activity

Organizations

None yet

upvoted a paper about 2 hours ago

SwanVoice: Expressive Long-Form Zero-Shot Speech Synthesis for Both Monologue and Dialogue

Paper • 2605.30993 • Published 18 days ago • 58

upvoted 8 papers about 3 hours ago

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

Paper • 2606.02373 • Published 15 days ago • 53

APPO: Agentic Procedural Policy Optimization

Paper • 2606.12384 • Published 5 days ago • 60

Agentic Environment Engineering for Large Language Models: A Survey of Environment Modeling, Synthesis, Evaluation, and Application

Paper • 2606.12191 • Published 6 days ago • 62

Role-Agent: Bootstrapping LLM Agents via Dual-Role Evolution

Paper • 2606.10917 • Published 6 days ago • 76

OCC-RAG: Optimal Cognitive Core for Faithful Question Answering

Paper • 2606.00683 • Published 17 days ago • 90

WeaveBench: A Long-Horizon, Real-World Benchmark for Computer-Use Agents with Hybrid Interfaces

Paper • 2606.09426 • Published 8 days ago • 98

GrepSeek: Training Search Agents for Direct Corpus Interaction

Paper • 2605.29307 • Published 19 days ago • 108

Audio Interaction Model

Paper • 2606.05121 • Published 13 days ago • 111

liked a dataset 26 days ago

zhifeixie/Voices-in-the-Wild-2M

Updated 17 days ago • 17k • 39

upvoted a paper about 1 month ago

Claw-Eval-Live: A Live Agent Benchmark for Evolving Real-World Workflows

Paper • 2604.28139 • Published Apr 30 • 42

upvoted 3 papers 3 months ago

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Paper • 2603.04597 • Published Mar 4 • 211

OpenClaw-RL: Train Any Agent Simply by Talking

Paper • 2603.10165 • Published Mar 10 • 156

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 198

upvoted 4 papers 4 months ago

SQuTR: A Robustness Benchmark for Spoken Query to Text Retrieval under Acoustic Noise

Paper • 2602.12783 • Published Feb 13 • 246

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Paper • 2602.05400 • Published Feb 5 • 355

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published Jan 30 • 113

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Paper • 2601.21558 • Published Jan 29 • 61

upvoted 2 papers 5 months ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 127

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

Paper • 2601.08225 • Published Jan 13 • 53