Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[HFUT_Student]使用其他数据集(ASSISTment_2015-2016)测试模型出错 #35

Open
yypan-sys opened this issue Dec 27, 2024 · 3 comments

Comments

@yypan-sys
Copy link

根据提示,不支持auto download,需要自行下载到本地
下载的数据为rawdata
然后进行raw_to_mid变换得到middata
所以更新框架,如下:
run_edustudio(
dataset='ASSIST_1516',
cfg_file_name=None,
traintpl_cfg_dict={'cls': 'GeneralTrainTPL','device': 'cpu'},
datatpl_cfg_dict={
'cls': 'KTInterCptUnfoldDataTPL',
'load_data_from': 'rawdata',
'raw2mid_op': 'R2M_ASSIST_1516'
},
modeltpl_cfg_dict={'cls': 'AKT',},
evaltpl_cfg_dict={'clses': ['PredictionEvalTPL'],}
)
但是经过测试,1213的数据集可以正常启动训练
但是1516的数据集会出现报错,如下:
unique_cpt_seq = df_exer['cpt_seq:token_seq'].explode().unique()
TypeError: 'NoneType' object is not subscriptable
分析得:1516数据集rawdata明显缺少信息
以1213的rawdata为例,包含start_time等缺失了的信息
解决方法:
检查datatpl框架,或许可以修改选取项M2C_BuildSeqInterFeats

@yypan-sys yypan-sys changed the title 使用其他数据集(ASSISTment_2015-2016)测试模型出错 [HFUT_Student]使用其他数据集(ASSISTment_2015-2016)测试模型出错 Dec 27, 2024
@yujiebing
Copy link

意识到是数据模板不匹配的问题,我和上面的同学查看了当前框架下的各个数据模板。但未能找到适配ASSISTment_2015-2016的数据模板。
859e8229-763b-44ae-8ba0-cc21f9c0181e
由于ASSISTment_2015-2016数据集本身栏目较少,经过其r2m协议,只生成了一张inter.csv表,而当前框架下的数据模板似乎都是要求有stu.csv和exer.csv的。

@yujiebing
Copy link

是否需要添加专门的数据模板,或该数据集项目缺少Knowledge Tracing所需要的基本栏目,暂时废弃(因为看到了R2M_ASSIST1516协议有许多代码被注释了)

@kervias
Copy link
Contributor

kervias commented Dec 29, 2024

感谢反馈!ASSIST1516数据集貌似需要基于ASSIST1213数据集的数据来构建知识点等信息,R2M_ASSIST1516的代码需要重写,后续我们处理下

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants