每日规划
2026 年 1 月 10 日
模块化我的 GNN 代码
模型方面
把 KAN 代码整理为:可以从任意数据集进行预测(动态根据填写的特征列名的数量决定有几个节点,而生成图的拓扑类型数量的逻辑不变、仍然自己写图的笛卡尔坐标逻辑,)
特征工程方面(以反应图为基准)
节点组分的特征:整理出 mordred 工具的一键式方案,RDKit 分子指纹的一键式方案,RDKit 分子描述符的一键式方案 图级特征:把 rxnfp 代码输出为.csv 文件的形式,方便后续合并到数据集中 边级特征:整理 出 bond type one-hot encoding 的一键式方案
模型模块化方面
class KAN 线性层 class SEBlock class ResNet 18 Block?
- 训练方面
lightning 模型封装 tensorboard 可视化
- 流水线
用 wandb 管理实验,模型训练,模型保存与加载,模型评估,结果可视化等功能 latex 进行论文写作 Git + GitHub 进行版本管理与协作(github 私有仓库的容量限制为 500MB,超过需要付费,可以考虑用 git-lfs 管理大文件)
反思:为什么要将简单的 ai 可以一分钟搞定的代码再次模块化?为了省半分钟的时间而消耗几个小时的时间吗?值得吗?
推翻!!
现在开始只要直接思考逻辑就行,不要再推敲模块化了!其实大部分文献中的代码的复杂程度,现在的 ai 已经可以独立完成了,没必要分步模块化,直接让 ai 帮我写出完整的代码就行!