SquareFace Blog


  • 首页

  • 关于

  • 标签

  • 归档

  • 搜索

pandas的factorize()理解

发表于 2020-03-07
字数统计: 318 | 阅读时长 ≈ 1

pandas的factorize()理解
官网说明
pandas.factorize(values, sort=False, order=None, na_sentinel=-1, size_hint=None)
Encode input values as an enumerated type or categorical variable

个人理解
factorize函数可以将Series中的标称型数据映射称为一组数字,相同的标称型映射为相同的数字。factorize函数的返回值是一个tuple(元组),元组中包含两个元素。第一个元素是一个array,其中的元素是标称型元素映射为的数字;第二个元素是Index类型,其中的元素是所有标称型元素,没有重复。

实例

import numpy as np
import pandas as pd
In [43]: df = pd.DataFrame({"id":[1,2,3,4,5,6,3,2], "raw_grade":['a', 'b', 'b',
    ...:  'a', 'a', 'e','c','a']})

In [44]: df
Out[44]:
   id raw_grade
0   1         a
1   2         b
2   3         b
3   4         a
4   5         a
5   6         e
6   3         c
7   2         a

In [45]: x = pd.factorize(df.raw_grade)

In [46]: x
Out[46]:
(array([0, 1, 1, 0, 0, 2, 3, 0], dtype=int64),
 Index(['a', 'b', 'e', 'c'], dtype='object'))
#array中的元素其实是df.raw_grade的对应位置元素在Index中的下标。例如array第一个元素是0,表示df.raw_grade的第一个元素为Index的第0个元素。

In [47]: x[1]
Out[47]: Index(['a', 'b', 'e', 'c'], dtype='object')

In [48]: x[0]
Out[48]: array([0, 1, 1, 0, 0, 2, 3, 0], dtype=int64)

In [49]: type(x)
Out[49]: tuple

磁共振启发

发表于 2020-03-06
字数统计: 114 | 阅读时长 ≈ 1

如何可以获得每个节点的数据?

  • 如果把植物的一个器官(大一点的组织)堪称一个结点,

存在的问题:

  • 区域划分的含义是什么?划分的结点有什么含义?这样也许可以证明信号的传递方向
  • 每一个结点的信号值如何计算呢?如果是建模的话,如何验证呢?
  • 把结点放大到植物的组织器官

抑郁症-磁共振

发表于 2020-03-05
字数统计: 1k | 阅读时长 ≈ 3

基于功能连接和有效连接的抑郁症诊断方法研究

研究意义

然抑郁症和健康被试有 如此多的结构和功能上的改变,我们只要能够找到其中某种稳定的改变足以区分 出抑郁症患者和健康被试,就可以把这种改变作为诊断抑郁症的标志

研究背景

  • 重度抑郁症患者与健康被试相比,存在特定脑部区域结构上的改变。
    这些有结构方面改变的脑区包括:额叶区域,前扣带皮层,眶额叶皮质,海马体和尾状核的一部分。

  • 脑区之间固有的功能连接的改变也在许多研究中被发现

脑功能网络也在抑郁症的病理原因方面扮演了重要的角色

默认网络,额顶网络,注意网络,凸显网络

  • Bin Zhang 等人发现抑郁症患者在特定的任务 条件下,默认网络会有一个显著的反激活现象。默认网络是一种在休息状态激活 而在任务状态不激活的一种特殊的网络,它被认为和人类的注意力,情绪等密切 相关。

  • 默认网络主要由四个主要的脑区组成,内侧前额叶皮层(MPFC),后扣 带回皮质(PCC), 左外侧顶叶(LP_L)和右外侧顶叶(LP_R)。

  • 背侧注意网络主要包 括左额叶区域(FEF_L),右额叶区域(FEF_R),左内沟区域(IPS_L)和右内沟区域 (IPS_R)。Fabio Sambataro 等人在与健康被试的对比分析中,发现了抑郁症患者 在背侧注意网络的异常改变[10]。

  • 凸显网络主要由前扣带皮层(ACC), 左额前额皮 质(RPFC_L)和右额前额皮质(RPFC_R)组成,在抑郁症相关的任务态核磁成像研 究中,该网络显示出了明显的低频振荡(LFO)增强现象[11]。额顶网络主要由左侧 前额叶皮层(LPFC_L), 右侧前额叶皮层(LPFC_R), 左后壁皮层(PPC_L)和右后壁 皮层(PPC_R)组成。Aneta Brzezicka 发现,前额叶和顶叶区之间无效信息传播可能是重度抑郁症形成的主要原因[12]。

功能连接

功能连接是空间上不相邻的脑区在静息状态下或者在外界的刺激下反应的 时间相关性。如果两个脑区对某个刺激反应的时间相关性比较大,这两个脑区的 功能连接就比较强。度量相关性可以多种方法,最常用的是皮尔逊相关系数。

  • 脑区划分,因为功能连接度量的是脑区之间的相关性,如何划分脑区会对最终的相关性结果产生影响。AAL 模版(Automated Anatomical Labeling)、(Brainnetome)模版对脑区进行划分。

有效连接

有效连接是一种在神经元水平上为脑区间信号响应进行因果建模的方法, 能够比较详细的分析出连接的改变。利用有效连接衡量这几个静息态脑网络的改 变可能比单纯使用功能连接更有效。DonaldR等人利用有效连接探索了重度抑郁症患者杏仁核和前扣带皮层的连接,发现与健康被试相比,有明显的异常。
功能连接和有效连接的异常性改变可能能够作为一种稳定的诊断标志

研究方法

时间序列

一般,仪器2s就可以对大脑进行一遍核磁共振扫描,得到一张3维图,即3维数据。如果每2s扫一次,扫多次,就可以得到随时间变化的一系列3维脑图,即再加一维时间维,为4维数据。对于大脑的某一个结点(固定前3维),可以得到一个时间序列(时间维变化)

Python表示图

发表于 2020-03-05
字数统计: 3 | 阅读时长 ≈ 1

Adjacency Matrix

Adjacency List

图论算法在生物网络数据上的应用

发表于 2020-03-03
字数统计: 596 | 阅读时长 ≈ 2

文章分为两个部分:

  1. 在必需蛋白预测研究中,考虑了蛋白所在的生物网络环境,以蛋白之间的连接关系重要程度来间接预测必需蛋白。除了主流的边聚类系数等图论特征,还利用了几何模型整合多种连接关系度量,有效减小了单一特征依赖问题。
  2. 在活跃信号通路识别问题中,引入 KEGG 知识库参与 背景网络构建过程,之后应用图论中的路径模型识别生物体在受到刺激后产生的 应激反应信号通路,该方法保留了分子所属通路信息,使结果更具解释性,方便 生物医学研究人员提出机理性假设。

IEW算法:http://digbio.missouri.edu/IEW/index.html

信号通路识别(多分子析协同作用机理方面)

http://digbio.missouri.edu/impres
活跃信号通路识别算法

算法利用动态规划的思想,针对代谢通路。

  1. 首先,利用 KEGG 数据库中对代谢通路的知识来构建背景网络。设计“类-实例”关系来扩展KEGG数据库中分子代谢通路,以获得基因参与的具体通路信息,
  2. 其次,基于组学数据为生物网络中的分子、分子连接和代谢 通路分配罚分,来逐步探索最优信号通路。
  3. 最后,从一个或多个起始基因开始,应用图论中的最短路径模型 识别下游信号通路,使其能最好地解释组学数据中分子的表达值。

活跃通路识别的目标

在生物体受到外界刺激或自身基因组位点突变后,找到生物网络中哪些部位活跃起来并做出了相应反应。

  • 合理地解释分子之间的级联反应顺序,即识别活跃信号通路

思考

  • 第一张提到哪些算法?在活跃信号通路识别领域
  • 图论中路径模型,都有那些算法,思想要了解,实现最简单的一个算法。文中提到最短路径,基于“节约生物系统”假设:生物会选择高效的路径完胜生物功能。
  • 网络节点的最小参与代价,这个是如何计算的?
1…678…25
Square Face

Square Face

少不吃苦是废人,老不吃苦是贵人

121 日志
3 分类
32 标签
GitHub E-Mail YouTube Instagram
© 2020 Square Face | Site words total count: 45.5k
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4