来源时间:2026年4月
学生姓名: 邹鹏
指导教师: 杨川龙
作品简介:
本文设计并实现了一套基于深度学习的动漫人物分类系统。系统利用Python语言结合PyTorch框架,采用深度残差网络ResNet18作为特征提取核心。在模型训练阶段,本文采集并构建了包含31类动漫角色的专用数据集,通过迁移学习方法对预训练模型进行微调,并引入注意力机制进行特征加权,配合定制化的九层深度分类器结构,在自建数据集上通过多次迭代优化,实现了从角色到作品的高精度分类能力。在应用实现层面,系统利用级联分类器实现人脸初定位,并基于PyQt5开发了具备动态滑块缩放功能的交互界面,有效解决了构图多样性带来的识别难题。同时,系统通过接入大语言模型接口,根据识别结果自动生成详尽的角色背景介绍,实现了从视觉分类到语义信息扩展的功能集成。
本系统的首要目标是判断输入图像中的动漫角色属于哪部作品,同时输出具体角色名称作为补充。
执行测试步骤:随机选取测试集图像,手动调整至最佳视野,记录分类结果(即模型输出的角色所属动漫是否与真实动漫一致)。
1. 火影忍者:
火影系列包含六种角色,分别是Naruto Uzumaki(漩涡鸣人)、Sasuke Uchiha(宇智波佐助)、Sakura Haruno(春野樱)、Kakashi Hatake(旗木卡卡西)、Hinata Hyuga(日向雏田)、Tsunade(纲手),如图6.5所示。

2. 海贼王:
海贼王系列包含六种角色,分别是Monkey D. Luffy(蒙奇·D·路飞)、Roronoa Zoro(罗罗诺亚·索隆)、Nami(娜美)、Sanji(山治)、Nico Robin(妮可·罗宾)、Boa Hancock(波雅·汉库克)。

3. 龙珠:
龙珠系列包含三种角色,如图6.7所示分别为Goku(孙悟空)、Vegeta(贝吉塔)、Android 18(人造人18号)。

4. 进击的巨人:
包含六种角色,如图6.8所示分别为Eren Yeager(艾伦·耶格尔)、Mikasa Ackerman(三笠·阿克曼)、Armin Arlert(阿尔敏·阿诺德)、Levi Ackerman(利威尔·阿克曼)、Historia Reiss(希斯特莉亚·雷斯)、Sasha Blouse(萨莎·布劳斯)。

5. 咒术回战:
包含三种角色,如图6.9所示从左到右依次为:Satoru Gojo(五条悟)、Yuji Itadori(虎杖悠仁)、Megumi Fushiguro(伏黑惠)。

6. 鬼灭之刃:
包含三种角色,如图6.10所示从左到右依次为:Nezuko Kamado(灶门祢豆子)、Zenitsu Agatsuma(我妻善逸)、Inosuke Hashibira(嘴平伊之助)。

7. 一拳超人:

8. 你的名字:
包含两种角色,从左到右依次为:Taki Tachibana(立花泷)、Katsuhiko Teshigawara(勅使河原克彦)。

创新点:
本本文设计并实现了一套基于深度学习的动漫人物分类系统,围绕高精度角色识别与智能化语义扩展两大核心目标,开展了从模型设计、训练优化到人机交互系统开发的完整研究。通过理论分析与实验验证,本文在以下几个方面取得了阶段性成果。
1.构建了适用于动漫人物分类的深度学习模型。针对动漫图像色彩夸张、背景复杂、画风多样的特点,本文以ResNet18为骨干网络,引入轻量化通道注意力机制,强化关键特征通道的响应,并设计了包含双重Dropout、批归一化及非线性激活的九层深度分类器。实验结果表明,该模型在自建31类动漫角色数据集上取得了89.7%的验证准确率,相比单层分类器提升7.4个百分点,验证了注意力机制与深度分类器协同结构的有效性。训练过程中采用迁移学习与数据增强策略,在有限样本条件下获得了良好的泛化能力。
2.提出了人机协同的交互控制方案。针对动漫图像构图多样、自动检测难以覆盖所有场景的问题,系统基于PyQt5框架设计了手动点击对焦与动态滑块缩放机制,使用户能够实时调整模型的关注区域。坐标映射与越界修正算法保证了点击位置与裁剪区域的精确对应。交互测试表明,该机制有效解决了自动定位不准时的特征缺失问题,显著提升了复杂构图下的识别成功率,体现了人机协同在视觉任务中的实用价值。
3.实现了视觉识别与语义知识的多模态集成。系统通过异步工作线程接入DeepSeek大语言模型API,根据识别结果自动生成角色百科介绍,涵盖出处背景、性格特点、经典台词等内容。LLM模块采用独立线程设计,避免了网络请求阻塞UI,保证了交互流畅性。该功能将分类标签扩展为结构化知识,丰富了信息展示维度,使系统从单纯的“图像分类器”升级为具备知识服务能力的智能工具。
- 上一篇:没有了
- 下一篇:智能考研院校推荐系统