姓名:毛琪
职称 / 硕(博)导:副教授 / 硕导
招生专业 / 方向:信息与通信工程 / 智能视频处理
主要研究领域:AIGC,图像视频生成, 智能图像视频编码
电子邮箱Email:qimao@cuc.edu.cn
个人简介
毛琪,bevictor伟德官网人工智能系副教授,媒体融合与传播国家重点实验室智能音视频团队成员。2021年7月毕业于北京大学获得计算机应用技术博士学位,同年9月加入韦德官方网站工作。2019年国家留学基金委资助加州大学默塞德分校联合培养博士,师从Prof. Ming-Hsuan Yang。2023.10月-2024.4月新加坡国立大学Show Lab实验室访问学者。目前担任中国图象图形学学会多媒体专委会委员,女工委委员,北京图象图形学学会青工委委员。
主要研究方向包括深度学习、深度生成模型、AIGC、视频编码、计算机视觉等。主持国家自然科学青年基金项目,作为骨干成员参与国家重点研发计划等,迄今共发表顶级国际期刊会议论文十余篇,其中多篇学术论文发表在International Journal of Computer Vision (IJCV),IEEE Computer Vision and Pattern Recognition(CVPR),ACM Special Interest Group on Data Communication(SIGCOMM),IEEE Transactions on Image Processing (TIP)等CCF A类顶级国际期刊和会议上,发表文章谷歌学术引用量超1000;授权专利多项,累计提交国内视频压缩标准AVS技术提案近十项,接收技术提案多项。获得2023年北京市图象图形学学会优秀博士论文奖,并入选2024年微软亚洲研究院铸星学者计划。
承担的主要科研项目
[1] 国家自然科学青年基金项目,62201526,基于分层特征表示的人-机协同视频编码研究,在研,主持,30万。
[2] 国家重点研发计划,2022YFF0902402,沉浸式文旅体验技术集成与场景创新,在研,骨干成员,254万。
[3] 百度NLP学术合作,HG23056,在研,主持,50万。
[4] 媒体融合与传播国家重点实验室专项科研项目,CUC22GZ035,深度学习人脸生成与鉴伪方法研究,音视频鉴伪系统,已结题,主持,20万。
[5] 媒体融合与传播国家重点实验室专项科研项目,CUC23GZ007,基于 AIGC 的对话多媒体内容生成,已结题,主持,16万。
代表性学术成果
[1] Qi Mao, Chongyu Wang, Meng Wang, Shiqi Wang, Ruijie Chen, Libiao Jin, Siwei Ma. Scalable Face Image Coding via StyleGAN Prior. Towards Compression for Human-Machine Collaborative Vision. IEEE Transactions on Image Processing (2023).(CCF-A, SCI-T2)
[2] Qi Mao, Hung-Yu Tseng, Hsin-Ying Lee, Jia-Bin Huang, Siwei Ma, Ming-Hsuan Yang. Continuous and Diverse Image-to-Image Translation via Signed Attribute Vectors. International Journal of Computer Vision (2022). (SCI-T2)
[3] Qi Mao(*), Siwei Ma. Enhancing Style-Guided Image-to-Image Translation via SelfSupervised Metric Learning. IEEE Transcations on Multimedia (2023). (SCI-T3)
[4] Qi Mao, Hsin-Ying Lee, Hung-Yu Tseng, Siwei Ma, Ming-Hsuan Yang: Mode-Seeking Generative Adversarial Networks for Diverse Image Synthesis. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition (2019). (CCF-A, 谷歌学术引用量:597)
[5] Hsin-Ying Lee, Hung-Yu Tseng, Qi Mao (*共同一作), Jia-Bin Huang, Yu-Ding Lu, Maneesh Singh, Ming-Hsuan Yang: DRIT++: Diverse Image-to-Image Translation via Disentangled Representations. International Journal of Computer Vision (2020). (SCI-T2)
[6] Jiangkai Wu, Yu Guan, Qi Mao, Yong Cui, Zongming Guo, Xinggong Zhang. ZGaming. Zero-latency 3D cloud gaming by image prediction. ACM SIGCOMM23(2023). (CCF-A -计算机网络传输领域顶会)
[7] Jianhui Chang, Zhenghui Zhao, Chuanmin Jia, Shiqi Wang, Lingbo Yang, Qi Mao, Jian Zhang, Siwei Ma. Conceptual Compression via Deep Structure and Texture Synthesis. IEEE Transactions on Image Processing (2022). (CCF-A,SCI-T2)
[8] Jianhui Chang, Jian Zhang, Jiguo Li, Shiqi Wang, Qi Mao, Chuanmin Jia, Siwei Ma, Wen Gao . Semantic-Aware Visual Decomposition for Image Coding. International Journal of Computer Vision (2023). (CCF-A ,SCI-T2)
[9] Qi Mao(*), Tinghan Yang, Yinuo Zhang, Zijian Wang, Meng Wang, Shiqi Wang, Libiao Jin, Siwei Ma: Extreme Image Compression Using Fine-tuned VQGANs. Data Compression Conference (2024). (CCF-B - 数据压缩领域顶会)
[10] Naifu Xue, Qi Mao(*), Zijian Wang, Yuan Zhang, Siwei Ma : Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer. IEEE International Conference on Multimedia and Expo (2024). (CCF-B - 计算机多媒体旗舰会议)
[11] 毛琪等,基于矢量量化索引和生成模型的极限图像压缩方法及系统,发明专利(授权)
[12] 毛琪等,面向人机混合视觉的可伸缩人脸图像编码方法、系统,发明专利(授权)
[13] 毛琪等,基于生成模型的人体视频压缩方法、系统,发明专利(授权)
[14] 毛琪等,生成-熵估计联合的极限图像压缩、解压缩方法及系统,发明专利(授权)