廖皆成 · Jiecheng Liao (James)

AI 算法工程候选人 · Multimodal / TTS / Vision
Contact
ICONIP'25 一作 (Oral) SIGGRAPH VRCAI'24 一作 Bilibili AI 平台实习 IndexTTS2 / MMVA-LLM IEEE TOPS
Liao, Jiecheng 至此,再无话可说...

研究方向:多模态 / TTS / 医学图像 / 2D&3D 视觉 / AI漏洞检测。

免责声明(叠甲): 本站为个人创作与实验展示,部分内容可能含有二创、梗图、戏仿或引用。所有恶搞与夸张表达仅为娱乐与艺术化呈现,不构成事实陈述或价值评判。若涉及版权或权益问题,纯属巧合。

📮 Contact (社恐,勿扰)

Tel 球你别使用盒武器
WeChat XJamesliaoX
Python PyTorch Multimodal TTS CV / 3D

🏆 Highlights

  • IndexTTS2情感拓展, 音视频理解研发, 智能视频剪辑Agent
  • ICONIP 2025 (Oral); ACM SIGGRAPH VRCAI 2024; ACM TOPS; Wiley IJIS

🎓 教育背景 Education

香港科技大学 · 工学院 · 人工智能 硕士

2025.08 – 2026.10

方向:AI / 多模态 / 音视频大模型

北师香港浸会大学 · 计算机科学与技术 学士

GPA 3.81 / 4.0 Rank 4 / 147 · Top 3%

论文:三维重建 / 医疗图像

🧁 实习经历 Internship

上海哔哩哔哩科技有限公司 · 人工智能平台部 · 算法实习生

2025.05 – 2025.07 TTS / Multimodal / Agent
  • IndexTTS2 文本情感表达拓展;结合情感理解小模型微调优化,SS约 97% 左右。
  • 基于多种 VLM/VQA 思路参与视频问答、自动摘要、Caption 标注与检索系统。
  • 自动剪辑 pipeline:细粒度视频理解 + 编辑策略,长视频预告片智能化剪辑,时序误差≈0.5s。

东亚银行 · 研发部 · 研发实习生

2024.07 – 2024.09 Security / GNN / Web
  • 研发 GNN 驱动的数据库/网络基础设施漏洞检测原型。
  • 设计并落地监控/告警脚本与轻量监督系统:p95 告警延迟 14.7s → 6.8s。
  • 完善内部安全工具 Web 界面;将 SDLC/架构培训最佳实践融入实现。

ITSC of UIC · 技术支持与开发

2021.11 – 2023.09 Campus Tools
  • 校园线上工具开发,为教职与学生提供技术支持。
  • 业务数据处理与可视化分析,输出报告辅助决策。

🧠 科研经历 & 代表论文 Research

MM-VALLM QA Voice Assistant

Under Development

A multimodal voice assistant prototype integrating VLMs for enhanced video Q&A capabilities.

BMS3: Bayesian Modeling Based SwinUNet Segmentation on Self-distillation Architecture

ICONIP 2025 · Oral 一作
  • 多中心 MRI:源域 Dice 92.2%,跨域平均 78.3%,整体优于对比方法。
  • 主导贝叶斯特征分解(shape/appearance)与 SwinUNet 融合;设计 EMA+温度缩放自蒸馏与消融。
  • 完成预处理、训练与评测搭建。

GBC: Gaussian-Based Colorization and Super-Resolution for 3D Reconstruction

ACM SIGGRAPH VRCAI 2024 一作
  • 黑白历史影像增强 + 3D 重建一体化管线(最高至 1440p)。
  • 主导 BOF-SR / TOF-CO 核心模块;打通 COLMAP 与 3DGS 训练和实时可视化。
  • 维护 Demo/Repo 与评测(SSIM/PSNR、重建指标)。

Smart Contract Vulnerability Detection based on Bytecode Augmentation and Semantic Structure Graph

IEEE Transactions on Privacy and Security After Major Revision

方向:安全与图结构建模;聚焦可部署的漏洞检测思路。

RSC++: Deep Multi-Scale Feature Aggregation for Accurate Polyp Segmentation

International Journal of Intelligent Systems Under Review

多尺度特征聚合模块设计与分割系统。

更多项目 / Demo

YOLOv8 越线预警 ESP32 输液监测
  • YOLOv8 精准区域管控与越线预警检测(含在线系统 Demo)。
  • ESP32 静脉输液实时监测与预警平台(IoT + 工程落地)。
  • 个人项目:网站搭建、Chatbot、互信息计算研究、cGAN 数据增强等。

🪄 技能 & 奖项 Skills & Awards

技能栈

语言:Python, C/C++, Java, Bash

框架:PyTorch, TensorFlow, Scikit-Learn, OpenCV

工程:SQL(MySQL), Linux, Git, Docker

奖学金

  • HKUST入学奖学金
  • HKBU Scholar Award (Top 2%)
  • BNBU 奖学金(2022/2024 一等;2023 二等)
  • 广东医谷奖学金(2025)

比赛 / 证书

  • 东方财富杯金融挑战赛(广东省赛区一等奖)
  • 广东省 AI 轮式机器人科创大赛(二等奖)
  • 蓝桥杯 C/C++ 组(三等奖)
  • Kaggle HuBMAP+HPA(Bronze)
  • 腾讯计算机视觉项目培训证书
📋 复制 Ctrl+C
📄 粘贴 Ctrl+V
🔍 搜索选中文本
📝 全选 Ctrl+A
🔄 刷新页面 F5