Publication List

Peer-reviewed Publications

^† equal contribution; ^* corresponding author(s)

[ICML 2026] CONTINUUM: Restoring the Contiguous Tensor Abstraction Efficiently for Dynamic AI Workloads via Hardware Virtualization [spotlight]

Authors: Yangyu Zhang^†, Shuoming Zhang^†, Chunwei Xia, Shuaijiang Li, Zhicheng Li, Ruiyuan Xu, Zheming Yang, Lei Chen, Yuan Wen, Guangli Li, Xiaobing Feng, Huimin Cui, Jiacheng Zhao^*
[ICML 2026] LEGO: An LLM-Enabled Hierarchical Optimizer for Tensor Computation Graphs with Structure-Aware Search and Compositional Synthesis

Authors: Ruiyuan Xu^†, Shuoming Zhang^†, Guangli Li, Qiuchu Yu, Rui Zhang, Yangyu Zhang, Hao Qian, Chunwei Xia, Jiacheng Zhao, Chenxi Wang, Xiaobing Feng, Jingling Xue, Huimin Cui
[CCS 2026] When Grammar Guides the Attack: Uncovering Control-Plane Vulnerabilities in LLMs with Structured Output

Authors: Shuoming Zhang, Jiacheng Zhao^*, Hanyuan Dong, Ruiyuan Xu, Zhicheng Li, Yangyu Zhang, Shuaijiang Li, Yuan Wen, Chunwei Xia, Zheng Wang, Xiaobing Feng, Huimin Cui [Download PDF] [arXiv]
[ISCA 2026] Symbiotic MLLM Serving: Dynamically Balancing Parallelism Across GPUs and Resources Within GPUs

Authors: Zhicheng Li, Jiacheng Zhao^*, Yangyu Zhang, Zhaolin Duan, Xinyu Liu, Siqi Li, Shuoming Zhang, Shuaijiang Li, Donglin Yu, Yuan Wen, Chunwei Xia, Xiyu Shi, Huimin Cui [Download PDF]
[CGO 26] From Threads to Tiles: T2T, a Compiler for CUDA-to-NPU Translation via 2D Vectorization [Distinguished Paper Award]

Authors: Shuaijiang Li, Jiacheng Zhao^*, Ying Liu, Shuoming Zhang, Lei Chen, Yijin Li, Yangyu Zhang, Zhicheng Li, Runyu Zhou, Xiyu Shi, Chunwei Xia, Yuan Wen, Xiaobing Feng, Huimin Cui [Download PDF]
[CCF THPC] The New Compiler Stack: A Survey on the Synergy of LLMs and Compilers

Authors: Shuoming Zhang, Jiacheng Zhao^*, Qiuchu Yu, Chunwei Xia, Zheng Wang, Xiaobing Feng, Huimin Cui [Download PDF]
[CCF THPC] LEGO-Compiler: Enhancing Neural Compilation Through Translation Composability

Authors: Shuoming Zhang, Jiacheng Zhao, Chunwei Xia, Zheng Wang, Yunji Chen, Xiaobing Feng, Huimin Cui^* [Download PDF]
[NeurIPS 2025] SpaceServe: Spatial Multiplexing of Complementary Encoders and Decoders for Multimodal LLMs [poster]

Authors: Zhicheng Li, Shuoming Zhang, Jiacheng Zhao^*, Siqi Li, Xiyu Shi, Yangyu Zhang, Shuaijiang Li, Donglin Yu, Zheming Yang, Yuan Wen, Huimin Cui [OpenReview]
[NeurIPS 2025] Mutual-Supervised Learning for Sequential-to-Parallel Code Translation [poster]

Authors: Changxin Ke, Rui Zhang^*, Shuo Wang, Li Ding, Guangli Li, Yuanbo Wen, Shuoming Zhang, Ruiyuan Xu, Jin Qin, Jiaming Guo, Chenxi Wang, Ling Li, Qi Guo, Yunji Chen [OpenReview]
[EMNLP 2024] Introducing Compiler Semantics into Large Language Models as Programming Language Translators: A Case Study of C to x86 Assembly [findings]

Authors: Shuoming Zhang, Jiacheng Zhao, Chunwei Xia, Zheng Wang, Yunji Chen, Huimin Cui^* [Download PDF]
[SCIS 2026] Large Processor Chip Model

Authors(Alphabetical order, equal contributions): Kaiyan Chang, Mingzhi Chen, Yunji Chen^*, Zhirong Chen, Dongrui Fan, Junfeng Gong, Nan Guo, Yinhe Han, Qinfen Hao, Shuo Hou, Xuan Huang, Pengwei Jin, Changxin Ke, Cangyuan Li, Guangli Li, Huawei Li, Kuan Li, Naipeng Li, Shengwen Liang, Cheng Liu, Hongwei Liu, Jiahua Liu, Junliang Lv, Jianan Mu, Jin Qin, Bin Sun, Chenxi Wang, Duo Wang, Mingjun Wang, Ying Wang^*, Chenggang Wu, Peiyang Wu, Teng Wu, Xiao Xiao, Mengyao Xie, Chenwei Xiong, Ruiyuan Xu, Mingyu Yan, Xiaochun Ye, Kuai Yu, Rui Zhang, Shuoming Zhang, Jiacheng Zhao [Download PDF] [Springer]

Pre-print Publications

[arXiv 2026] Learning When to Optimize: Verified Optimization Skills from Expert GPU-Kernel Lineages

Authors: Shuoming Zhang^†, Qiuchu Yu^†, Yangyu Zhang, Ruiyuan Xu, Xiyu Shi, Guangli Li, Xiaobing Feng, Huimin Cui, Jiacheng Zhao^* [Download PDF] [arXiv]

Shuoming Zhang

Peer-reviewed Publications

Pre-print Publications