[HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 #35

yypan-sys · 2024-12-27T13:08:47Z

根据提示，不支持auto download，需要自行下载到本地
下载的数据为rawdata
然后进行raw_to_mid变换得到middata
所以更新框架，如下：
run_edustudio(
dataset='ASSIST_1516',
cfg_file_name=None,
traintpl_cfg_dict={'cls': 'GeneralTrainTPL','device': 'cpu'},
datatpl_cfg_dict={
'cls': 'KTInterCptUnfoldDataTPL',
'load_data_from': 'rawdata',
'raw2mid_op': 'R2M_ASSIST_1516'
},
modeltpl_cfg_dict={'cls': 'AKT',},
evaltpl_cfg_dict={'clses': ['PredictionEvalTPL'],}
)
但是经过测试，1213的数据集可以正常启动训练
但是1516的数据集会出现报错，如下：
unique_cpt_seq = df_exer['cpt_seq:token_seq'].explode().unique()
TypeError: 'NoneType' object is not subscriptable
分析得：1516数据集rawdata明显缺少信息
以1213的rawdata为例，包含start_time等缺失了的信息
解决方法：
检查datatpl框架，或许可以修改选取项M2C_BuildSeqInterFeats

yujiebing · 2024-12-27T13:16:53Z

意识到是数据模板不匹配的问题，我和上面的同学查看了当前框架下的各个数据模板。但未能找到适配ASSISTment_2015-2016的数据模板。

由于ASSISTment_2015-2016数据集本身栏目较少，经过其r2m协议，只生成了一张inter.csv表，而当前框架下的数据模板似乎都是要求有stu.csv和exer.csv的。

yujiebing · 2024-12-28T17:40:44Z

是否需要添加专门的数据模板，或该数据集项目缺少Knowledge Tracing所需要的基本栏目，暂时废弃(因为看到了R2M_ASSIST1516协议有许多代码被注释了）

kervias · 2024-12-29T02:57:17Z

感谢反馈！ASSIST1516数据集貌似需要基于ASSIST1213数据集的数据来构建知识点等信息，R2M_ASSIST1516的代码需要重写，后续我们处理下

yypan-sys changed the title ~~使用其他数据集（ASSISTment_2015-2016）测试模型出错~~ [HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 Dec 27, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 #35

[HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 #35

yypan-sys commented Dec 27, 2024

yujiebing commented Dec 27, 2024

yujiebing commented Dec 28, 2024

kervias commented Dec 29, 2024

[HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 #35

[HFUT_Student]使用其他数据集（ASSISTment_2015-2016）测试模型出错 #35

Comments

yypan-sys commented Dec 27, 2024

yujiebing commented Dec 27, 2024

yujiebing commented Dec 28, 2024

kervias commented Dec 29, 2024