处理重复化学小分子

查看 73|回复 8
作者:greatzdl   
[Python] 纯文本查看 复制代码from rdkit import Chem
def remove_duplicates_smiles(smiles_list):
    unique_inchikeys = set()
    unique_smiles = []
   
    for smiles in smiles_list:
        mol = Chem.MolFromSmiles(smiles)
        if mol:
            inchikey = Chem.MolToInchiKey(mol)
            if inchikey not in unique_inchikeys:
                unique_inchikeys.add(inchikey)
                unique_smiles.append(smiles)
   
    return unique_smiles
# 示例用法
smiles_list = ["CCO", "CCO", "CCN", "CCN", "CCC"]
unique_smiles_list = remove_duplicates_smiles(smiles_list)
print(unique_smiles_list)
这个是简单的处理示例。本质上就是利用inchikey作为分子的唯一标识,来进行分子去除重复。
因为smiles这种方式表示分子,同一个分子可以有很多中smiles。没有有唯一性。
欢迎交流。

分子, 示例

sona124311   

很精炼!
kwoyh   

学一学怎么用
icho   

楼主是懂化学的
SoftCracker   

化学小分子?什么情况
艾莉希雅   

感觉还是半透膜会好用一点,楼主这个写完了丢反应器里要怎么用啊
aukw   

化学小分子?好专业。。。到底是啥
greatzdl
OP
  


aukw 发表于 2024-8-3 16:42
化学小分子?好专业。。。到底是啥

平时生病吃的药片的主要成分都是小分子化合物,是他们到了人体内产生了某些作用。
本质上 我们吃的饭 里面有 葡萄糖 氨基酸 果糖 都是小分子
laotzudao0   

学到了,化学小分子
您需要登录后才可以回帖 登录 | 立即注册

返回顶部