layout: home
title: AlphaFold2
date: 2024-04-06
status: DONE
author:
- AllenYGY
tags:
- DeepLearning
- Research
- Paper
created: 2024-04-06T22:36
updated: 2024-06-14T17:00
publish: True
AlphaFold2
模型大概可以分成四个部分
特征提取两部分信息
MSA提取序列在多物种中的共进化信息
提取氨基酸之间的特征
MSA Representation
Pair Representation
MSA和Pair都会进入多头自注意力模块
Pair的部分还需要加入物理上三角不等式的处理
与Transformer不同
根据Encoder的输出拿到
记录下一个氨基酸与上一个氨基酸的相对位置
把编码器的输出和解码器的输出通过回收机制传回编码器的输入
Training
Training
Fine-tuning
先在有标号的数据集PDB里训练一个模型, 通过这个模型预测没有标号的数据形成一个大一些的数据集,然后选择置信度较高的数据,加上原来有标号的数据,训练新的模型
Uniclust3036
and make a new dataset of predicted structures filtered to a high-confidence subset.