归档 | Awen's Paper Libarary

2026 ⁷

April ⁷

Alternating Reinforcement Learning for Rubric-Based Reward Modeling in Non-Verifiable LLM Post-Training

April 23, 2026 · 8 min · 1541 words · Your Name

CapRL: Stimulating Dense Image Caption Capabilities via Reinforcement Learning

April 20, 2026 · 5 min · 997 words · Your Name

RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning

April 17, 2026 · 6 min · 1110 words · Your Name

Reinforcement Learning with Rubric Anchors

April 15, 2026 · 5 min · 897 words · Your Name

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

April 13, 2026 · 4 min · 705 words · Your Name

Rubrics as Rewards: Reinforcement Learning Beyond Verifiable Domains

April 11, 2026 · 4 min · 668 words · Your Name

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

April 10, 2026 · 3 min · 620 words · Your Name

2024 ²

February ¹

Deep Residual Learning for Image Recognition

February 10, 2024 · 2 min · 331 words · Your Name

January ¹

Attention Is All You Need

January 15, 2024 · 2 min · 303 words · Your Name