基于深度学习的动漫人物分类系统设计_智能科学与技术_大连东软信息学院--智能与电子工程学院

基于深度学习的动漫人物分类系统设计

日期：2026-05-11 作者：杨川龙来源：浏览量：45

来源时间：2026年4月

学生姓名: 邹鹏

指导教师: 杨川龙

作品简介：

本文设计并实现了一套基于深度学习的动漫人物分类系统。系统利用Python语言结合PyTorch框架，采用深度残差网络ResNet18作为特征提取核心。在模型训练阶段，本文采集并构建了包含31类动漫角色的专用数据集，通过迁移学习方法对预训练模型进行微调，并引入注意力机制进行特征加权，配合定制化的九层深度分类器结构，在自建数据集上通过多次迭代优化，实现了从角色到作品的高精度分类能力。在应用实现层面，系统利用级联分类器实现人脸初定位，并基于PyQt5开发了具备动态滑块缩放功能的交互界面，有效解决了构图多样性带来的识别难题。同时，系统通过接入大语言模型接口，根据识别结果自动生成详尽的角色背景介绍，实现了从视觉分类到语义信息扩展的功能集成。

本系统的首要目标是判断输入图像中的动漫角色属于哪部作品，同时输出具体角色名称作为补充。

执行测试步骤：随机选取测试集图像，手动调整至最佳视野，记录分类结果（即模型输出的角色所属动漫是否与真实动漫一致）。

1. 火影忍者：

火影系列包含六种角色，分别是Naruto Uzumaki（漩涡鸣人）、Sasuke Uchiha（宇智波佐助）、Sakura Haruno（春野樱）、Kakashi Hatake（旗木卡卡西）、Hinata Hyuga（日向雏田）、Tsunade（纲手），如图6.5所示。

2. 海贼王：

海贼王系列包含六种角色，分别是Monkey D. Luffy（蒙奇·D·路飞）、Roronoa Zoro（罗罗诺亚·索隆）、Nami（娜美）、Sanji（山治）、Nico Robin（妮可·罗宾）、Boa Hancock（波雅·汉库克）。

3. 龙珠：

龙珠系列包含三种角色，如图6.7所示分别为Goku（孙悟空）、Vegeta（贝吉塔）、Android 18（人造人18号）。

4. 进击的巨人：

包含六种角色，如图6.8所示分别为Eren Yeager（艾伦·耶格尔）、Mikasa Ackerman（三笠·阿克曼）、Armin Arlert（阿尔敏·阿诺德）、Levi Ackerman（利威尔·阿克曼）、Historia Reiss（希斯特莉亚·雷斯）、Sasha Blouse（萨莎·布劳斯）。

5. 咒术回战：

包含三种角色，如图6.9所示从左到右依次为：Satoru Gojo（五条悟）、Yuji Itadori（虎杖悠仁）、Megumi Fushiguro（伏黑惠）。

6. 鬼灭之刃：

包含三种角色，如图6.10所示从左到右依次为：Nezuko Kamado（灶门祢豆子）、Zenitsu Agatsuma（我妻善逸）、Inosuke Hashibira（嘴平伊之助）。

7. 一拳超人：

8. 你的名字：

包含两种角色，从左到右依次为：Taki Tachibana（立花泷）、Katsuhiko Teshigawara（勅使河原克彦）。

创新点：

本本文设计并实现了一套基于深度学习的动漫人物分类系统，围绕高精度角色识别与智能化语义扩展两大核心目标，开展了从模型设计、训练优化到人机交互系统开发的完整研究。通过理论分析与实验验证，本文在以下几个方面取得了阶段性成果。

1.构建了适用于动漫人物分类的深度学习模型。针对动漫图像色彩夸张、背景复杂、画风多样的特点，本文以ResNet18为骨干网络，引入轻量化通道注意力机制，强化关键特征通道的响应，并设计了包含双重Dropout、批归一化及非线性激活的九层深度分类器。实验结果表明，该模型在自建31类动漫角色数据集上取得了89.7%的验证准确率，相比单层分类器提升7.4个百分点，验证了注意力机制与深度分类器协同结构的有效性。训练过程中采用迁移学习与数据增强策略，在有限样本条件下获得了良好的泛化能力。

2.提出了人机协同的交互控制方案。针对动漫图像构图多样、自动检测难以覆盖所有场景的问题，系统基于PyQt5框架设计了手动点击对焦与动态滑块缩放机制，使用户能够实时调整模型的关注区域。坐标映射与越界修正算法保证了点击位置与裁剪区域的精确对应。交互测试表明，该机制有效解决了自动定位不准时的特征缺失问题，显著提升了复杂构图下的识别成功率，体现了人机协同在视觉任务中的实用价值。

3.实现了视觉识别与语义知识的多模态集成。系统通过异步工作线程接入DeepSeek大语言模型API，根据识别结果自动生成角色百科介绍，涵盖出处背景、性格特点、经典台词等内容。LLM模块采用独立线程设计，避免了网络请求阻塞UI，保证了交互流畅性。该功能将分类标签扩展为结构化知识，丰富了信息展示维度，使系统从单纯的“图像分类器”升级为具备知识服务能力的智能工具。

【收藏本页】

返回首页关闭页面