Shiyi Cao

May '25	Excited to announce the release of SkyRL, an RL framework for training Real-World Long-Horizon Agents!
Oct '24	Two papers (MoE-Lightning and GraphPipe) accepted at ASPLOS '25!
Oct '23	Released S-LoRA, a scalable system for serving thousands of LoRA adapters concurrently!
Aug '23	Graduated from ETH and joined UC Berkeley EECS!
Sept '22	Paper accepted at ExaMPI workshop, SC '22!
Sept '20	Started to study as a master student in Computer Science at ETH Zürich.

	MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs (Arxiv) Shiyi Cao, Shu Liu, Tyler Griggs, Peter Schafhalter, Xiaoxuan Liu, Ying Sheng, Joseph E Gonzalez, Matei Zaharia, Ion Stoica ASPLOS 2025. Mixture of Experts; LLM Batch Inference; CPU Offloading.
	GraphPipe: Improving Performance and Scalability of DNN Training with Graph Pipeline Parallelism (Arxiv) Byungsoo Jeon, Mengdi Wu, Shiyi Cao, Sunghyun Kim, Sunghyun Park, Neeraj Aggarwal, Colin Unger, Daiyaan Arfeen, Peiyuan Liao, Xupeng Miao, Mohammad Alizadeh, Gregory R. Ganger, Tianqi Chen, Zhihao Jia ASPLOS 2025. Distributed Training; Pipeline Parallelism.
	Fairness in Serving Large Language Models (Arxiv) Ying Sheng, Shiyi Cao, Dacheng Li, Banghua Zhu, Zhuohan Li, Danyang Zhuo, Joseph E Gonzalez, Ion Stoica OSDI 2024. LLM Serving; Fair Scheduling.
	S-LoRA: Serving Thousands of Concurrent LoRA Adapters (Arxiv, Github, Blog) Ying Sheng, Shiyi Cao, Dacheng Li, Coleman Hooper, Nicholas Lee, Shuo Yang, Christopher Chou, Banghua Zhu, Lianmin Zheng, Kurt Keutzer, Joseph E. Gonzalez, Ion Stoica MLSys 2024. LLM Inference; LoRA; Adapters; Memory Management.
	Accelerating Data Serialization/Deserialization Protocols with In-Network Compute (pdf, video) Shiyi Cao, Salvatore Di Girolamo, Torsten Hoefler Workshop on Exascale MPI, ExaMPI@SC, 2022. SmartNICs; In-Network Compute; Data (De)serialization.
	AdaM: An Adaptive Fine-Grained Scheme for Distributed Metadata Management Shiyi Cao, Yuanning Gao, Xiaofeng Gao, Guihai Chen International Conference on Parallel Processing (ICPP), 2019. Distributed Systems; Metadata Management; Reinforcement Learning.

Shiyi Cao 「曹诗怡」