三人行,必有我师焉
积土成山,风雨兴焉;积水成渊,蛟龙生焉
Hey,我们是冷涵 (Lenghan),隽逸 (Julian), 凯 (Mark),和霄浩阳 (Xiaohaoyang)!
我们是一群对技术充满热情、在各自领域不断探索的伙伴。从AI框架的深层构建到尖端半导体技术的研究,再到多模态应用的创新,我们致力于学习、创造并分享我们的旅程。很高兴能在这里与你相遇,一起交流思想,共同进步。
我是冷涵 (Lenghan)。我目前是卡耐基梅隆大学 (Carnegie Mellon University)计算机工程专业的在读硕士。我对人工智能框架的底层开发与优化抱有浓厚兴趣,曾经从零开始完整实现了Transformer的核心机制,并且有幸为Intel的OpenVINO深度学习推理优化框架贡献过关键算子。
在多模态AI技术领域,我主导开发了 EchoFrame项目,这是一个用于从无声视频直接生成高保真、语义相关音频的多模态AI框架。我们利用了CLIP和CLAP等视觉和音频基础模型,并结合潜空间扩散模型进行音频合成,在VGGSound数据集上取得了超越基线的效果,甚至成功为OpenAI Sora生成的无声视频配上了相关的声音。
你可以在 GitHub (DeanZhu1128) 上找到我。
研究与技术兴趣:深度学习系统、多模态AI、AI框架开发与优化、PyTorch、C++
我是隽逸 (Julian)。我在华盛顿大学 (University of Washington)开始我的电子与计算机工程硕士学习生涯。此前,我毕业于西交利物浦大学,获得了信息与计算科学专业的学士学位。
我对数据结构与算法、计算机视觉、数据科学以及大型语言模型 (LLM) 等领域尤为关注。在本科期间,我曾作为研究助理参与了“R2I:基于知识蒸馏的光伏板缺陷诊断语义分割系统”项目,并发表了相关会议论文。此外,我也参与了一个“新型主动式桥梁预警系统”的研究,负责目标检测部分的编码工作,并对传统追踪方法的稳定性问题进行了创新性改进。
我也有幸在企业中实习,担任过Java后端开发实习生,参与了智慧城市平台的开发与维护,实践了包括Spring Boot、微服务、Redis缓存优化等技术。欢迎通过 LinkedIn 与我联系。
研究与技术兴趣:数据科学、计算机视觉、全栈开发、人工智能应用、机器学习
我是霄浩阳 (Xiaohaoyang)。我在蒙纳士大学 (Monash University)开始我的数据科学硕士学习。此前,我在利物浦大学获得了电子工程与电子学的学士学位,并在西交利物浦大学完成了电信工程的学习 [cite: 39]。
我的研究经历主要集中在“单片集成GaN基芯片设计与生产”方面,作为研究助理,我参与了转换器电路多个模块的建模与仿真,并承担了大部分的Reticle设计与修改以及流片过程中的多项关键工艺步骤,如光刻、掺杂、薄膜沉积和刻蚀等,最终实现了超过70%的良率。此外,我对计算机体系结构与机器学习也充满兴趣,研究过基于双峰语义分割的知识迁移学习方法,并对FPGA的主流设计模式及其优化路径进行了总结与展望。
我曾发表过关于GaN基DC-DC浮动降压转换器的论文,并与钧翊合作发表了关于光伏板深度故障诊断系统的论文。我的技能包括Python (Pytorch, Numpy)、C/C++、Verilog HDL以及多种电路设计和仿真工具。
研究与技术兴趣:数据科学、半导体器件与芯片设计、机器学习、计算机体系结构、嵌入式系统
我是马凯 (Mark)。我即将在杜克昆山大学 (Duke Kunshan University)攻读医学物理硕士学位(由杜克大学授予)。此前,我获得了利物浦大学的电子与电气工程荣誉工学学士学位,以及西交利物浦大学的通信工程工学学士学位。在西交利物浦大学期间,我曾获得学术卓越奖(专业前5%)。
在学术实践方面,我参与了多个项目。我作为共同作者参与了 SciSafeEval 项目,这是一个评估大型语言模型 (LLM) 在科学任务中安全性的综合基准。我参与设计并实现该基准系统,整理了一个包含31,840个样例的大规模数据集,并开发了包括无害性、有益性和拒绝率在内的评估指标。此外,我们还进行了严格的“越狱”测试,以分析LLM在对抗性提示下的脆弱性。
我还作为共同作者参与了“基于知识蒸馏的光伏板深度故障诊断语义分割系统”项目。在该项目中,我协助完成了数据采集,并对算法进行了调整以优化其性能,同时简化了U-Net架构以降低模型复杂度,使其更适合实际部署。该研究成果已被 EPEE 2023 国际会议接收。
另外,我曾担任“基于深度学习与毫米波雷达的手势识别”项目的研究助理。我们开发了一个集成德州仪器毫米波传感器和3D卷积神经网络 (3DCNN) 的手势识别系统,设计并实现了数据采集流程,包括原始FMCW雷达信号的预处理、体素化和特征提取。通过优化轻量级3DCNN模型,我们在复杂手势分类上达到了92%的准确率,并设计了实时图形用户界面 (GUI) 以增强用户体验。
在实习经历方面,我曾在苏州永臻科技股份有限公司担任实习生,负责确保公司计算机网络和信息系统的安全,安装和管理多种低压电缆及电缆系统,并参与机房运维工作,获得了IT部门优秀实习生称号。
研究与技术兴趣:医学物理、大型语言模型安全性、深度学习、计算机视觉、毫米波雷达应用、数据分析。