静待花开2333 发表于 2021-4-8 16:11:30

淋巴癌预后分析

问题描述
通过分析淋巴癌患者在医院治疗期间的数据,结合患者的肿瘤发现位置、手术手段、治疗方法、周期等
信息,预测其在未来一段时间的存活情况。具体的数据如下图
问题分析
数据存储的格式为Excel,这是典型的结构化的数据,对于这类问题来说,我们第一时间需要想到的就
是用是传统的机器学习算法,例如SVM、GBDT等模型对其进行快速验证。
解题方法
1. 此类数据绝大多数的呈现形式为结构化的数据形式,此类数据具有明显的特点就是会有若干的特征
去描述一个样本,上例中会使用年龄、性别等特征表征一个病人的基本状态。
2. 对于这类的结构化数据使用XGBoost这样的树模型算法求解这样的问题就能取得不错的效果。
3. 在这个问题中,存在字符串编码的一些特征状态,例如【PTI(肿瘤分布)】,我们创新得提出了
一种基于MultiHot Embedding的编码方式对这类的数据进行转化,取得不错的效果提升。
合作成绩
1. 提出专利项:《种基于MultiHot Embedding的xxx》
2. 著有论文篇:《基于xxx的淋巴癌肿瘤预后分析方法》
还有别的问题请微信联系17777856823
页: [1]
查看完整版本: 淋巴癌预后分析