估计阅读时长: 4 分钟https://github.com/dotvanilla/vanilla vanilla编译器项目是我之前开发过的一个实验性质的项目。主要是为了解决在浏览器端的一些高性能计算的需求,例如数据加密和解密,基于WebGL的计算机图形项目,力学物理规律模拟,网络可视化布局计算等。 Order by Date Name Attachments 1_PcKt44c-UZBBTfNBaovxeQ • 49 kB • 640 click 2021年7月8日web-assembly-architecture-xenonstack-3-1 • […]
估计阅读时长: 6 分钟https://github.com/xieguigang/linux-profiler 废话不多说,首先给出一个 demo报告链接 给大家看看这个小工具的成品输出。 在去年的工作中,因为公司需要购买新的服务器做集群计算,需要一个工具来记录之前的服务器在数据分析上的性能瓶颈。于是花了两天的时间赶出来了这个专门应用于Linux系统的性能记录工具。这个小工具是一个开源项目,大家可以在Github上阅读这个开源项目(linux-profiler)的源代码。 Order by Date Name Attachments systemLoad • 53 kB • 724 […]
估计阅读时长: < 1 分钟https://github.com/rsharp-lang/R-sharp R#语言最开始的开发需求来自于对GCModeller的组件的调用需求。因为最开始GCModeller使用的是命令行模式进行运行,但是因为VB.NET语言为编译型语言,所开发的应用程序在发布之后,用户无法轻易的修改。自己对于一些比较个性化的数据分析,在引入R#语言之前,需要专门编写一段命令行代码跑GCModeller,会十分的不方便。所以后面就有了R#脚本语言的开发。 R#语言类似于R或者Matlab语言,也是一种向量化的编程脚本语言。其语法源自于R语言,同时也结合了一些TypeScript的语法,例如TypeScript之中的字符串插值语法就被引入了R#语言之中。 const words = ["world", "R# language", "GCModeller User"]; const hello = `hello ${words}!`; […]

[…] 对于基于ec number来生成层级数据,我们直接使用《酶EC编号结构解析》文章末尾所展示的层级数据生成函数来实现。 […]
[…] 在前面的一篇《基因组功能注释(EC Number)的向量化嵌入》博客文章中,针对所注释得到的微生物基因组代谢信息,进行基于TF-IDF的向量化嵌入之后。为了可视化向量化嵌入的效果,通过UMAP进行降维,然后基于降维的结果进行散点图可视化。通过散点图可视化可以发现向量化的嵌入结果可以比较好的将不同物种分类来源的微生物基因组区分开来。 […]
😲啊?
谢老师,写快点呀,在看着你更新文章呢。
[…] 最近的工作中我需要按照之前的这篇博客文章《基因组功能注释(EC Number)的向量化嵌入》中所描述的流程,将好几十万个微生物基因组的功能蛋白进行酶编号的比对注释,然后基于注释结果进行向量化嵌入然后进行数据可视化。通过R#脚本对这些微生物基因组的蛋白fasta序列的提取操作,最终得到了一个大约是58GB的蛋白序列。然后将这个比较大型的蛋白序列比对到自己所收集到的ec number注释的蛋白序列参考数据库之上。 […]