KEGG所有ko及对应通路整理

2025-7-18

下载json文件

点击这里进入下载页面，右键从链接另存文件

获得的json文件如图：

使用python处理json文件

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式，在python中可使用json包进行解码与编码，主要涉及四个方法：load, loads, dump, dumps。

json.loads：将json字符串解码为python对象
json.dumps：将python对象编码为json字符串
json.load和json.dump：分别与json.loads, json.dumps的功能对应，但需要传入文件描述符，对文件进行操作

import json

# 读入 JSON
with open('C:/Users/law/Desktop/ko00001.json', encoding='utf-8') as f:
    data = json.load(f)

out_lines = []

# 递归函数
def walk(node, lvls):
    """
    node : dict
    lvls : list[str]  当前已累积的层级（最多 3 级：L1/L2/L3）
    """
    name = node['name']
    kids = node.get('children', [])

    # 根据已累积层级决定下一步
    if len(lvls) < 3:                    # 继续向下收集层级
        for ch in kids:
            walk(ch, lvls + [name])
    else:                                # 已到叶子层，解析 KO
        try:
            ko, *desc = name.strip().split(maxsplit=1)
            desc = ' '.join(desc) if desc else ''
            ko = 'ko:' + ko if not ko.startswith('ko:') else ko
            out_lines.append('\t'.join([ko] + lvls + [desc]))
        except Exception:
            pass

# 从根节点的第一层 children 开始
for child in data['children']:
    walk(child, [])

# 写出 TSV
with open('C:/Users/law/Desktop/ko_pathway1.txt', 'w', encoding='utf-8') as f:
    f.write('KO\tPathwayL1\tPathwayL2\tPathwayL3\tKoDescription\n')
    f.write('\n'.join(out_lines))

整理好的kegg通路文件：

参考链接: https://zhuhaizhen.github.io/2020/06/30/KEGG-all-kos/

版权声明 1 本文章标题：KEGG所有ko及对应通路整理
2 本文章地址：https://www.leoduo.cn/kegg_tlzhengli.html
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请发送邮件至2733997298@qq.com进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 如您发现本站提供资源链接失效或有违规现象，请联系我们处理。

THE END

MetaPhlAn 4—宏基因组物种注释工具

<<上一篇

一文学会！12种带统计检验的柱状图绘制，宝藏工具EcoAmp速上手

下一篇>>

KEGG所有ko及对应通路整理

下载json文件

使用python处理json文件

批量重命名文件名称(windows端)

KEGG所有ko及对应通路整理

UCAS / 懒人评教方法

FAPROTAX功能注释