大拇哥 0

你好,我是李丁一祺

一名热爱 人工智能交叉学科 的算法工程师

个人照片

关于我

个人简介

自我介绍

  • 你好,我是一名算法工程师,对 AI 与自然科学的交叉问题充满热情,致力于探索数据背后的科学本质。
  • 研究方向:多模态大模型和 AI for Science,专注于将前沿AI技术应用于解决复杂科学问题。
  • 从城市与地图出发,在城市复杂系统中探索,我一路走向深度学习和大模型研究。在这个过程中,我逐渐对复杂系统的建模产生了浓厚兴趣——尤其是那些看起来充满数据、但背后隐藏着更多人类行为与科学机理的问题。

研究兴趣

  • AI 与自然科学的交叉问题研究
  • 热衷于探索"为什么"的科学本质
  • 关注数据驱动与科学机制的结合

专业技能

  • 多源异构数据处理
  • 深度学习模型的设计、训练与优化
  • 多模态模型微调与跨模态适配
  • 基于 RAG 的 LLM 开发经验

未来展望

  • 探索 AI 世界中的科学之美
  • 期待与志同道合的伙伴共同进步

教育背景

  • 厦门大学校徽

    厦门大学 人工智能研究院

    人工智能(硕士)

  • 深圳大学校徽

    深圳大学 城市信息工程系

    地理空间信息工程(本科)

    GPA: 85/100(Ranking 5)

    英语:CET-6,IELTS 7

专业技能

💻 Programming Languages

Python 95%
Matlab 90%
C++ 85%
JavaScript 85%

🤖 Deep Learning & AI

Natural Language Processing (NLP) 90%
Large Language Model Applications 80%
Computer Vision 80%
Model Deployment & Inference 75%

🗺️ GIS

Spatial Analysis 90%
GIS Application Development 85%
Remote Sensing Data Processing 85%
Geospatial Visualization 80%

🧠 Multimodal Foundation Models

Multimodal Reasoning (Text + Image/Audio) 85%
Multimodal Prompt Engineering 80%
Fine-tuning Multimodal Models 80%
Frameworks: MiniCPM, Qwen, VITA 75%

项目经验

城市色彩与情感制图数据
城市色彩与情感制图技术路线

基于街景大数据的城市色彩与情感制图分析

运用深度学习模型,使用街景影像作为数据源,研究城市色彩与居民情绪的关联关系。开发基于UNet与Kmeans的语义分割模型, 提取街景图像色彩特征,结合ResNet-50进行情感分类,构建10000+街景图像数据集。

深度学习 计算机视觉 国际会议报告
骑手平台数据
骑手平台技术路线

"骑心协力"多源数据驱动的外卖员智慧骑手辅助平台

基于Vue.js+Element UI开发SPA应用,实现外卖骑手配送路径优化。负责轨迹数据抓取和清理,封装10+可复用组件, 创新性地开发基于地理坐标的留言系统,集成高德地图API实现坐标标记,使用ECharts实现配送热力图可视化,显著提升了骑手配送效率。

Vue.js GIS开发 数据可视化
联邦学习数据
联邦学习技术路线

融合多源时空数据的城市联邦学习方法研究

研究多源异构大数据(图像、POI、环境污染物、经济数据)与城市信用的关系。创新性地实现城市中不同部门在不共享原始数据的情况下,通过联邦学习进行数据特征共享的深度学习。 深入探讨城市联邦学习在不同算法下的性能差异以及街道信用的空间分布情况,为城市信用评估提供了新的技术路径。

联邦学习 多源数据 空间分析
遥感分类系统界面1
遥感分类系统界面2

基于像素的遥感影像分类系统

基于Qt框架开发的遥感影像分类系统,集成了多种先进的分类算法。系统采用模块化设计,左侧展示待分类图像信息,右侧提供多种分类算法选择。 支持非监督分类(K-means聚类、ISODATA分类)和监督分类(随机森林、卷积神经网络)。其中CNN分类包含HRNet、DeepLabv3+和PSPNet等前沿模型。 系统支持3-8波段遥感影像处理,采用Python实现核心算法,通过PyQt5实现界面交互,实现了算法的高效集成与可视化展示。

PyQt5 深度学习 遥感影像处理

实习经历

多模态大模型算法工程师实习生

深圳某科技上市公司

2025
实习需求
技术路线
实习体验

负责多模态大模型(如 Qwen、MiniCPM 等)的调研分析、微调与工程适配,涵盖图文理解、语音理解、跨模态对齐等任务。针对实际应用场景进行模型结构改造与推理引擎(vLLM)优化,使模型推理效率提升约 8%,显存占用降低约 12%。

主导多模态输入统一处理框架的设计与实现,支持图文语音的灵活组合输入,显著提升模型在多场景下的适配性。参与多个下游任务的模型微调,提升心理对话、图文问答等任务表现约 5%-10%。

开发并部署一个基于 RAG(Retrieval-Augmented Generation)架构的心理辅导对话机器人,支持情绪识别、知识检索与多轮对话交互,内测用户好评率达 92%。该系统融合大模型与专业心理知识库,实现轻量化部署与实时响应。

多模态大模型 PyTorch vLLM RAG 模型优化

荣誉获奖

竞赛获奖

  • 中国大学生 GIS 软件开发大赛

    一等奖(2022)

  • 全国大学生测绘学科创新创业智能大赛

    特等奖(2023)

  • 全国大学生数学建模竞赛

    二等奖(2023)

  • 上海开放数据大赛

    百强(前20%)(2022)

论文发表

  • Quantifying Urban Colors and Emotions with Street-view Image and Deep Learning

    GSCS & ICUI

  • 融合多源时空数据的城市联邦学习方法研究

    毕业论文

联系我

留言板(暂未开通)

留言列表(暂未开通)

留言地图

点击地图上的标记可以查看该位置的留言

颜色越深表示该位置的留言越多

丁丁智能小助手
你好!我是小丁丁,很高兴为你服务!