音频表情识别求助 #769

Open
opened 2025-08-05 09:20:19 +08:00 by malone · 0 comments

我想编写一个中文音频表情识别程序,用在手机端。目前发现满足条件的微调模型特别少,要么体积比较大wav2vec,采用量化或者蒸馏后会丢失很多精度,要么准确率达不到。有没有推荐的。另外找了一下符合条件的中文数据集也比较少,只能找到casia和ESD,有没有其他推荐的。

我想编写一个中文音频表情识别程序,用在手机端。目前发现满足条件的微调模型特别少,要么体积比较大wav2vec,采用量化或者蒸馏后会丢失很多精度,要么准确率达不到。有没有推荐的。另外找了一下符合条件的中文数据集也比较少,只能找到casia和ESD,有没有其他推荐的。
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#769
No description provided.