Publications | Shaobo Wang (王少博)

2026

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Shaobo Wang , Xuan Ouyang , Tianyi Xu , Yuzheng Hu , Jialin Liu , Guo Chen , Tianyu Zhang , Junhao Zheng , and 3 more authors

arXiv preprint arXiv:2602.05400, 2026

Bib

@article{wang2026opus,
  title = {OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration},
  author = {Wang, Shaobo and Ouyang, Xuan and Xu, Tianyi and Hu, Yuzheng and Liu, Jialin and Chen, Guo and Zhang, Tianyu and Zheng, Junhao and Yang, Kexin and Ren, Xingzhang and others},
  journal = {arXiv preprint arXiv:2602.05400},
  year = {2026},
}

arXiv

Socratic-Geo: Synthetic Data Generation and Geometric Reasoning via Multi-Agent Interaction

Zhengbo Jiao , Shaobo Wang , Zifan Zhang , Wei Wang , Bing Zhao , Hu Wei , and Linfeng Zhang

arXiv preprint arXiv:2602.03414, 2026

Bib

@article{jiao2026socratic,
  title = {Socratic-Geo: Synthetic Data Generation and Geometric Reasoning via Multi-Agent Interaction},
  author = {Jiao, Zhengbo and Wang, Shaobo and Zhang, Zifan and Wang, Wei and Zhao, Bing and Wei, Hu and Zhang, Linfeng},
  journal = {arXiv preprint arXiv:2602.03414},
  year = {2026}
}

ICLR

Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data?

Shaobo Wang , Cong Wang , Wenjie Fu , Yue Min , Mingquan Feng , Isabel Guan , Xuming Hu , Conghui He , and 6 more authors

2026

Bib

@misc{wang2025rethinkingllmevaluationevaluate,
  title = {Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data?},
  author = {Wang, Shaobo and Wang, Cong and Fu, Wenjie and Min, Yue and Feng, Mingquan and Guan, Isabel and Hu, Xuming and He, Conghui and Wang, Cunxiang and Yang, Kexin and Ren, Xingzhang and Huang, Fei and Liu, Dayiheng and Zhang, Linfeng},
  booktitle = {The Fourteenth International Conference on Learning Representations},
  year = {2026},
  url = {https://openreview.net/forum?id=lZlZjSxdio}
}

ICLR

Grounding and Enhancing Informativeness and Utility in Dataset Distillation

Shaobo Wang , Yantai Yang , Guo Chen , Peiru Li , Kaixin Li , Yufa Zhou , and Zhaorun Chen Zhang

The Fourteenth International Conference on Learning Representations, 2026

Bib

@article{wang2026grounding,
  title = {Grounding and Enhancing Informativeness and Utility in Dataset Distillation},
  author = {Wang, Shaobo and Yang, Yantai and Chen, Guo and Li, Peiru and Li, Kaixin and Zhou, Yufa and andLinfeng Zhang, Zhaorun Chen},
  journal = {The Fourteenth International Conference on Learning Representations},
  year = {2026},
  url = {https://openreview.net/forum?id=ThsYRbpv2F}
}

WWW

Bridging Visual Dynamics and Narrative Reasoning: Multimodal Large Language Models for Short Drama Quality Assessment

Qingyang Liu , Jiangtong Li , Zelin Peng , Shaobo Wang , Zhaohe Liao , Shuochen Chang , Bingjie Gao , Haonan Zhao , and 3 more authors

In The ACM Web Conference 2026 Industry Track , 2026

Bib

@inproceedings{liu2026bridging,
  title = {Bridging Visual Dynamics and Narrative Reasoning: Multimodal Large Language Models for Short Drama Quality Assessment},
  author = {Liu, Qingyang and Li, Jiangtong and Peng, Zelin and Wang, Shaobo and Liao, Zhaohe and Chang, Shuochen and Gao, Bingjie and Zhao, Haonan and Liu, Mu and Jiang, Jidong and Niu, Li},
  booktitle = {The ACM Web Conference 2026 Industry Track},
  year = {2026},
  url = {https://openreview.net/forum?id=Fkwvsf7U8N},
}

AAAI

UNSEEN: Enhancing Dataset Pruning from a Generalization Perspective

Furui Xu* , Shaobo Wang* , Jiajun Zhang , Chenghao Sun , Haixiang Tang , and Linfeng Zhang

Annual AAAI Conference on Artificial Intelligence, 2026

Bib PDF

@article{xu2026unseen,
  title = {UNSEEN: Enhancing Dataset Pruning from a Generalization Perspective},
  author = {Xu*, Furui and Wang*, Shaobo and Zhang, Jiajun and Sun, Chenghao and Tang, Haixiang and Zhang, Linfeng},
  journal = {Annual AAAI Conference on Artificial Intelligence},
  year = {2026},
}

AAAI

ImagebindDC: Compressing Multimodal Data with Imagebind-based Condensation

Yue Min* , Shaobo Wang* , Jiaze Li , Tianle Niu , Junxin Fan , Yongliang Miao , Lijin Yang , and Linfeng Zhang

Annual AAAI Conference on Artificial Intelligence, 2026

Bib PDF

@article{min2026imagebinddc,
  title = {ImagebindDC: Compressing Multimodal Data with Imagebind-based Condensation},
  author = {Min*, Yue and Wang*, Shaobo and Li, Jiaze and Niu, Tianle and Fan, Junxin and Miao, Yongliang and Yang, Lijin and Zhang, Linfeng},
  journal = {Annual AAAI Conference on Artificial Intelligence},
  year = {2026},
}

2025

CVPR highlight

Dataset Distillation with Neural Characteristic Function: A Minmax Perspective

Shaobo Wang , Yicun Yang , Zhiyuan Liu , Chenghao Sun , Xuming Hu , Conghui He , and Linfeng Zhang

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2025

Bib PDF Code News (Chinese)

@article{wang2025dataset,
  title = {Dataset Distillation with Neural Characteristic Function: A Minmax Perspective},
  author = {Wang, Shaobo and Yang, Yicun and Liu, Zhiyuan and Sun, Chenghao and Hu, Xuming and He, Conghui and Zhang, Linfeng},
  year = {2025},
  journal = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  news_zh = {https://mp.weixin.qq.com/s/VtIqPF_a098qAEvrTKbi6A}
}

ACL main

Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning

Shaobo Wang , Xiangqi Jin , Ziming Wang , Jize Wang , Jiajun Zhang , Kaixin Li , Zichen Wen , Zhong Li , and 3 more authors

Annual Meeting of the Association for Computational Linguistics, 2025

Bib PDF Code Website

@article{wang2025datawhisperer,
  title = {Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning},
  author = {Wang, Shaobo and Jin, Xiangqi and Wang, Ziming and Wang, Jize and Zhang, Jiajun and Li, Kaixin and Wen, Zichen and Li, Zhong and He, Conghui and Hu, Xuming and Zhang, Linfeng},
  year = {2025},
  journal = {Annual Meeting of the Association for Computational Linguistics},
}

ICLR

Gnothi Seauton: Empowering Faithful Self-Interpretability in Black-Box Transformers

Shaobo Wang , Hongxuan Tang , Mingyang Wang , Hongrui Zhang , Xuyang Liu , Weiya Li , Xuming Hu , and Linfeng Zhang

International Conference on Learning Representations, 2025

Bib PDF Code

@article{wang2024gnothi,
  title = {Gnothi Seauton: Empowering Faithful Self-Interpretability in Black-Box Transformers},
  author = {Wang, Shaobo and Tang, Hongxuan and Wang, Mingyang and Zhang, Hongrui and Liu, Xuyang and Li, Weiya and Hu, Xuming and Zhang, Linfeng},
  year = {2025},
  primaryclass = {cs.LG},
  journal = {International Conference on Learning Representations},
}

arXiv

Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

Shaobo Wang , Jiaming Wang , Jiajun Zhang , Cong Wang , Yue Min , Zichen Wen , Fei Huang , Huiqiang Jiang , and 3 more authors

2025

PDF
arXiv

Socratic-Zero: Bootstrapping Reasoning via Data-Free Agent Co-evolution

Shaobo Wang , Zhengbo Jiao , Zifan Zhang , Yilang Peng , Xu Ze , Boyu Yang , Wei Wang , Hu Wei , and 1 more author

2025

PDF

arXiv

VideoCompressa: Data-Efficient Video Understanding via Joint Temporal Compression and Spatial Reconstruction

Shaobo Wang , Tianle Niu , Runkang Yang , Deshan Liu , Xu He , Zichen Wen , Conghui He , Xuming Hu , and 1 more author

2025

Bib

@misc{wang2025videocompressa,
  title = {VideoCompressa: Data-Efficient Video Understanding via Joint Temporal Compression and Spatial Reconstruction},
  author = {Wang, Shaobo and Niu, Tianle and Yang, Runkang and Liu, Deshan and He, Xu and Wen, Zichen and He, Conghui and Hu, Xuming and Zhang, Linfeng},
  year = {2025},
  eprint = {2511.18831},
  archiveprefix = {arXiv},
  primaryclass = {cs.CV},
  url = {https://arxiv.org/abs/2511.18831}
}

arXiv

Dd-ranking: Rethinking the evaluation of dataset distillation

Zekai Li , Xinhao Zhong , Samir Khaki , Zhiyuan Liang , Yuhao Zhou , Mingjia Shi , Ziqiao Wang , Xuanlei Zhao , and 3 more authors

2025

Bib PDF Code

@article{li2025dd,
  title = {Dd-ranking: Rethinking the evaluation of dataset distillation},
  author = {Li, Zekai and Zhong, Xinhao and Khaki, Samir and Liang, Zhiyuan and Zhou, Yuhao and Shi, Mingjia and Wang, Ziqiao and Zhao, Xuanlei and Zhao, Wangbo and Qin, Ziheng and others},
  year = {2025}
}

arXiv

CircuitSeer: Mining High-Quality Data by Probing Mathematical Reasoning Circuits in LLMs

Shaobo Wang , Yongliang Miao , Yuancheng Liu , Qianli Ma , Ning Liao , and Linfeng Zhang

2025

Bib PDF

@misc{wang2025circuitseermininghighqualitydata,
  title = {CircuitSeer: Mining High-Quality Data by Probing Mathematical Reasoning Circuits in LLMs},
  author = {Wang, Shaobo and Miao, Yongliang and Liu, Yuancheng and and Qianli Ma and Liao, Ning and Zhang, Linfeng},
  year = {2025},
  eprint = {2510.18470},
  archiveprefix = {arXiv},
  primaryclass = {cs.AI},
  url = {https://arxiv.org/abs/2510.18470},
}

NeurIPS

Efficient Multi-modal Large Language Models via Progressive Consistency Distillation

Zichen Wen , Shaobo Wang , Yufa Zhou , Junyuan Zhang , Qintong Zhang , Yifeng Gao , Zhaorun Chen , Bin Wang , and 3 more authors

2025

Bib

@misc{zhang2025efficient,
  title = {Efficient Multi-modal Large Language Models via Progressive Consistency Distillation},
  author = {Wen, Zichen and Wang, Shaobo and Zhou, Yufa and Zhang, Junyuan and Zhang, Qintong and Gao, Yifeng and Chen, Zhaorun and Wang, Bin and Li, Weijia and He, Conghui and Zhang, Linfeng},
  year = {2025}
}

arXiv

Shifting AI Efficiency From Model-Centric to Data-Centric Compression

Xuyang Liu* , Zichen Wen* , Shaobo Wang* , Junjie Chen , Zhishan Tao , Yubo Wang , Xiangqi Jin , Chang Zou , and 8 more authors

2025

Bib PDF

@misc{liu2025shiftingaiefficiencymodelcentric,
  title = {Shifting AI Efficiency From Model-Centric to Data-Centric Compression},
  author = {Liu*, Xuyang and Wen*, Zichen and Wang*, Shaobo and Chen, Junjie and Tao, Zhishan and Wang, Yubo and Jin, Xiangqi and Zou, Chang and Wang, Yiyu and Liao, Chenfei and Zheng, Xu and Chen, Honggang and Li, Weijia and Hu, Xuming and He, Conghui and Zhang, Linfeng},
  year = {2025},
  eprint = {2505.19147},
  archiveprefix = {arXiv},
  primaryclass = {cs.CL},
}

arXiv

dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching

Zhiyuan Liu , Yicun Yang , Yaojie Zhang , Junjie Chen , Chang Zou , Qingyan Wei , Shaobo Wang , and Linfeng Zhang

2025

Bib PDF Code

@misc{liu2025dllm,
  title = {dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching},
  author = {Liu, Zhiyuan and Yang, Yicun and Zhang, Yaojie and Chen, Junjie and Zou, Chang and Wei, Qingyan and Wang, Shaobo and Zhang, Linfeng},
  year = {2025},
}

arXiv

Reasoning Like an Economist: Post-Training on Economic Problems Induces Strategic Generalization in LLMs

Yufa Zhou* , Shaobo Wang* , Xingyu Dong* , Xiangqi Jin , Yifang Chen , Yue Min , Xingzhang Ren , Kexin Yang , and 2 more authors

2025

Bib PDF Code

@misc{recon,
  title = {Reasoning Like an Economist: Post-Training on Economic Problems Induces Strategic Generalization in LLMs},
  author = {Zhou*, Yufa and Wang*, Shaobo and Dong*, Xingyu and Jin, Xiangqi and Chen, Yifang and Min, Yue and Ren, Xingzhang and Yang, Kexin and Liu, Dayiheng and Zhang, Linfeng},
  year = {2025},
}

EMNLP main

Stop Looking for Important Tokens in Multimodal Language Models: Duplication Matters More

Zichen Wen , Yifeng Gao , Shaobo Wang , Junyuan Zhang , Qintong Zhang , Weijia Li , Conghui He , and Linfeng Zhang

2025

Bib PDF

@article{wen2025stoplookingimportanttokens,
  title = {Stop Looking for Important Tokens in Multimodal Language Models: Duplication Matters More},
  author = {Wen, Zichen and Gao, Yifeng and Wang, Shaobo and Zhang, Junyuan and Zhang, Qintong and Li, Weijia and He, Conghui and Zhang, Linfeng},
  year = {2025},
  eprint = {2502.11494},
  archiveprefix = {arXiv},
  primaryclass = {cs.CL},
}

ACMMM

Compute only 16 tokens in one timestep: Accelerating Diffusion Transformers with Cluster-Driven Feature Caching

Zhixin Zheng , Xinyu Wang , Chang Zou , Shaobo Wang , and Linfeng Zhang

ACM Multimedia, 2025

Bib PDF

@article{zheng2025compute,
  title = {Compute only 16 tokens in one timestep: Accelerating Diffusion Transformers with Cluster-Driven Feature Caching},
  author = {Zheng, Zhixin and Wang, Xinyu and Zou, Chang and Wang, Shaobo and Zhang, Linfeng},
  journal = {ACM Multimedia},
  year = {2025},
}

ACMMM

SpeCa: Accelerating Diffusion Transformers with Speculative Feature Caching

Jiacheng Liu , Chang Zou , Yuanhuiyi Lyu , Fei Ren , Shaobo Wang , Kaixin Li , and Linfeng Zhang

ACM Multimedia, 2025

Bib PDF

@article{zheng2025computf,
  title = {SpeCa: Accelerating Diffusion Transformers with Speculative Feature Caching},
  author = {Liu, Jiacheng and Zou, Chang and Lyu, Yuanhuiyi and Ren, Fei and Wang, Shaobo and Li, Kaixin and Zhang, Linfeng},
  journal = {ACM Multimedia},
  year = {2025},
}

arXiv

Diffusion LLM with Native Variable Generation Lengths: Let [EOS] Lead the Way

Yicun Yang , Cong Wang , Shaobo Wang , Zichen Wen , Biqing Qi , Hanlin Xu , and Linfeng Zhang

arXiv preprint arXiv:2510.24605, 2025

Bib

@article{yang2025diffusion,
  title = {Diffusion LLM with Native Variable Generation Lengths: Let [EOS] Lead the Way},
  author = {Yang, Yicun and Wang, Cong and Wang, Shaobo and Wen, Zichen and Qi, Biqing and Xu, Hanlin and Zhang, Linfeng},
  journal = {arXiv preprint arXiv:2510.24605},
  year = {2025}
}

CVPR workshop

Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation

Shaobo Wang , Yantai Yang , Qilong Wang , Kaixin Li , Linfeng Zhang , and Junchi Yan

Synthetic Data for Computer Vision Workshop at CVPR, 2025

Bib PDF

@article{wang2024samples,
  title = {Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation},
  author = {Wang, Shaobo and Yang, Yantai and Wang, Qilong and Li, Kaixin and Zhang, Linfeng and Yan, Junchi},
  year = {2025},
  eprint = {2408.12483},
  archiveprefix = {arXiv},
  primaryclass = {cs.CV},
  journal = {Synthetic Data for Computer Vision Workshop at CVPR}
}

2024

ECCV

Think2Drive: Efficient Reinforcement Learning by Thinking with Latent World Model for Autonomous Driving (in CARLA-V2)

Qifeng Li , Xiaosong Jia , Shaobo Wang , and Junchi Yan

European Conference on Computer Vision, 2024

Bib PDF

@article{li2024think2drive,
  title = {Think2Drive: Efficient Reinforcement Learning by Thinking with Latent World Model for Autonomous Driving (in CARLA-V2)},
  author = {Li, Qifeng and Jia, Xiaosong and Wang, Shaobo and Yan, Junchi},
  journal = {European Conference on Computer Vision},
  year = {2024},
}

NeurIPS

Unveiling Induction Heads: Provable Training Dynamics and Feature Learning in Transformers

Siyu Chen , Heejune Sheen , Tianhao Wang , and Zhuoran Yang

Advances in Neural Information Processing Systems, 2024

Bib PDF Code

@article{chen2024unveiling,
  title = {Unveiling Induction Heads: Provable Training Dynamics and Feature Learning in Transformers},
  author = {Chen, Siyu and Sheen, Heejune and Wang, Tianhao and Yang, Zhuoran},
  journal = {Advances in Neural Information Processing Systems},
  year = {2024},
}

ICLR workshop

DRUPI: Dataset Reduction Using Privileged Information

Shaobo Wang , Yantai Yang , Shuaiyu Zhang , Chenghao Sun , Weiya Li , Xuming Hu , and Linfeng Zhang

The Future of Machine Learning Data Practices and Repositories at ICLR, 2024

Bib PDF

@article{wang2024drupi,
  title = {DRUPI: Dataset Reduction Using Privileged Information},
  author = {Wang, Shaobo and Yang, Yantai and Zhang, Shuaiyu and Sun, Chenghao and Li, Weiya and Hu, Xuming and Zhang, Linfeng},
  year = {2024},
  eprint = {2410.01611},
  archiveprefix = {arXiv},
  primaryclass = {cs.CV},
  journal = {The Future of Machine Learning Data Practices and Repositories at ICLR},
}

2023

arXiv

Unified Batch Normalization: Identifying and Alleviating the Feature Condensation in Batch Normalization and a Unified Framework

Shaobo Wang , Xiangdong Zhang , and Junchi Yan

arXiv preprint arXiv:2311.15993 (arXiv), 2023

Bib PDF

@article{wang2023unified,
  title = {Unified Batch Normalization: Identifying and Alleviating the Feature Condensation in Batch Normalization and a Unified Framework},
  author = {Wang, Shaobo and Zhang, Xiangdong and Yan, Junchi},
  year = {2023},
  eprint = {2311.15993},
  archiveprefix = {arXiv},
  primaryclass = {cs.CV},
  journal = {arXiv preprint arXiv:2311.15993 (arXiv)}
}

2022

arXiv

Trap of Feature Diversity in the Learning of MLPs

Dongrui Liu* , Shaobo Wang* , Jie Ren , Kangrui Wang , Sheng Yin , Huiqi Deng , and Quanshi Zhang

arXiv preprint arXiv:2112.00980 (arXiv), 2022

Bib PDF

@article{liu2022trap,
  title = {Trap of Feature Diversity in the Learning of MLPs},
  author = {Liu*, Dongrui and Wang*, Shaobo and Ren, Jie and Wang, Kangrui and Yin, Sheng and Deng, Huiqi and Zhang, Quanshi},
  year = {2022},
  eprint = {2112.00980},
  archiveprefix = {arXiv},
  primaryclass = {cs.LG},
  journal = {arXiv preprint arXiv:2112.00980 (arXiv)}
}

2021

NeurIPS

Visualizing the emergence of intermediate visual patterns in dnns

Mingjie Li , Shaobo Wang , and Quanshi Zhang

Advances in Neural Information Processing Systems, 2021

Bib PDF Code

@article{li2021visualizing,
  title = {Visualizing the emergence of intermediate visual patterns in dnns},
  author = {Li, Mingjie and Wang, Shaobo and Zhang, Quanshi},
  journal = {Advances in Neural Information Processing Systems},
  volume = {34},
  pages = {6594--6607},
  year = {2021},
}