前端开发视角看数据结构-记一次项目中数据结构的选择

作者: coolcao | 来源:发表于2019-10-16 21:43 被阅读0次

前端开发视角看数据结构-记一次项目中数据结构的选择
2019-07-01
安卓中扩展数据结构的探究解析
《大话数据结构》第一，二章
基础定义
数据结构与算法学习-001(基本概念)
非常心仪的某大公司的招聘要求，该如何具体的解读这个要求？
经典编程书籍大全
软件开发技术栈
如果有人让你推荐编程技术书，请叫他看这个列表

最近在写一个博客的小项目，对接github的钩子，当提交markdown工程至github时，通过设置github的钩子，程序获取提交的markdown源码，包括新增，更新，删除的文件列表，然后将其拉取到数据库。前端解析markdown文本至html页面展示。
中间遇到一个很有意思的问题：目录的解析。

markdown的目录结构可能如下:前端/js/you_dont_konw_js,前端/js/node_at_scale,前端/css等等。我在解析的时候，将其解析成数组：[['前端','js','your_dont_konw_js'],['前端','js','node_at_scale'],['前端','css']]，其中的每一项表示每个文件所在的目录。
在有一个分类的页面中，我想将每个目录中文档个数统计出来，并想展示其目录结构，预期如下：

从数据库中查出来的原始数组如下：

let catalogs =
[
    [
        "ComputerSystem"
    ],
    [
        "ComputerSystem"
    ],
    [
        "ComputerSystem"
    ],
    [
        "ComputerSystem"
    ],
    [],
    [
        "css"
    ],
    [
        "NetWork"
    ],
    [
        "css"
    ],
    [
        "c語言"
    ],
    [
        "c語言"
    ],
    [
        "c語言"
    ],
    [
        "c語言"
    ],
    [
        "c語言"
    ],
    [
        "c語言"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "你不知道的js笔记"
    ],
    [
        "js",
        "你不知道的js笔记"
    ],
    [
        "js",
        "你不知道的js笔记"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "数据结构与算法笔记"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "dsa_js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js"
    ],
    [
        "js",
        "you_dont_konw_js"
    ],
    [
        "js",
        "nodejs_at_scale"
    ],
    [
        "js",
        "you_dont_konw_js"
    ]
]

其实统计文档数目很简单：

let obj = {};
catalogs.reduce((pre,current) => {
    return pre.concat(current);
},[]).forEach(item => {
    let keys = Object.keys(obj);
    if(keys.includes(item)){
        obj[item] ++;
    }else{
        obj[item] = 1;
    }
});

console.log(obj);

先将二维数组扁平化到一维，然后进行统计即可，输出的结果：

{ ComputerSystem: 4,
  css: 2,
  NetWork: 1,
  'c語言': 6,
  js: 67,
  '你不知道的js笔记': 3,
  '数据结构与算法笔记': 1,
  dsa_js: 9,
  you_dont_konw_js: 12,
  nodejs_at_scale: 7 }

这里统计好了每个目录里总文档的个数，但是有个问题是，目录之间没有层级关系，在页面上展示时，不好展示。

这里抽象一下的话，目录应该是一个树形的结构，因此，很容易想到使用一个树结构。

第一次，写了一个函数，由上面这个数组，生成一个树型结构对象：

/**
 * 构建目录树结构
 * @param  {Array} catalogs [目录树数组，结构如下：]
 * [['博客','mongo'],['博客','js'],['随笔','音乐'],['随笔','电影','喜剧电影']]
 * @return {obj}          [树结构]
 */
let createCatalogTree = function createCatalogTree(catalogs) {
    let obj = {
        key: 'catalog',
        count: 0,
        child: []
    };



    let insert = (item, parent) => {
        let key = obj.key;
        let child = obj.child;
        let o = obj; //当前parent所在的对象
        let has = false; //标识item是否已经存在
        let existed = null; //已经存在item的对象

        while (key != parent) {
            for (let c of child) {
                key = c.key;
                child = c.child;
                o = c;
                if(key == parent){
                    break;
                }
            }
        }
        // console.log(JSON.stringify(obj));
        if (o.child && Array.isArray(o.child)) {
            for (let ch of o.child) {
                if (ch.key == item) {
                    existed = ch;
                    has = true;
                    break;
                }
            }
        }

        if (existed) {
            existed.count++;
        } else {
            o.child.push({
                key: item,
                count: 1,
                child: []
            });
            // o.count ++;
        }

    };
    catalogs.forEach(catalog => {
        for (let i = 0; i < catalog.length; i++) {
            // console.log(catalog[i]);
            if (i === 0) {
                insert(catalog[i], 'catalog');
            } else {
                insert(catalog[i], catalog[i - 1]);
            }
        }
    });
    //重置顶层目录计数统计
    obj.child.forEach(item => {
        obj.count += item.count;
    });
    return obj;
}

跑一下，扔出来的结构：

{
  "key": "catalog",
  "count": 81,
  "child": [
    {
      "key": "ComputerSystem",
      "count": 4,
      "child": []
    },
    {
      "key": "css",
      "count": 2,
      "child": []
    },
    {
      "key": "NetWork",
      "count": 1,
      "child": []
    },
    {
      "key": "c語言",
      "count": 6,
      "child": []
    },
    {
      "key": "js",
      "count": 67,
      "child": [
        {
          "key": "你不知道的js笔记",
          "count": 3,
          "child": []
        },
        {
          "key": "dsa_js",
          "count": 9,
          "child": []
        },
        {
          "key": "you_dont_konw_js",
          "count": 12,
          "child": []
        },
        {
          "key": "nodejs_at_scale",
          "count": 7,
          "child": []
        }
      ]
    },
    {
      "key": "数据结构与算法笔记",
      "count": 1,
      "child": []
    }
  ]
}

这个函数虽然实现了功能，但是逻辑混乱，另外效率也不高。

每个元素的插入要指定其父元素，每次都得从头查找父元素，所以效率不高。而且每次查找逻辑都冗余在插入逻辑中，混乱。

可以将这个树抽象成一个树对象，将查找，插入等等抽象成其方法。

但是，由于每个目录有多个子目录，因此，不能用简单的二叉树。

改完的树类：

let find = (item, tree) => {
    let q = [];
    let r = null;
    q.push(tree);
    while (q.length) {
        let t = q.shift();
        if (t.key == item) {
            r = t;
            break;
        }
        q = q.concat(t.child);
    }
    return r;
}
class CatalogTree {
    constructor(catalogs) {
        this.key = 'catalog';
        this.count = 0;
        this.child = [];
        if(catalogs && Array.isArray(catalogs)){
            catalogs.forEach(catalog => {
                if(Array.isArray(catalog) && catalog.length > 0){
                    // this.count ++;
                    this.insert(catalog);
                }
            });
        }
    }

    find(item) {
        return find(item, this);
    }

    /**
     * 插入目录
     * @param  {Array} catalog 目录数组，型如：['技术','前端','nodejs']
     */
    insert(catalog = required()) {
        if (!Array.isArray(catalog)) {
            throw new Error('catalog类型错误，只能是数组');
        }

        //如果目录数组为空，则直接返回
        if(catalog.length <= 0){
            return this;
        }

        //每进行一次正常插入，计数加1
        this.count ++;

        let tree = this;
        let last_found = this;

        while (catalog.length > 0) {
            let item = catalog.shift();
            tree = find(item, tree);
            if (tree) {
                tree.count++;
                last_found = tree;
            } else {
                let new_node = {
                    key: item,
                    count: 1,
                    child: []
                };
                last_found.child.push(new_node);
                while (catalog.length > 0) {
                    new_node.child.push(new_node = {
                        key: catalog.shift(),
                        count: 1,
                        child: []
                    });
                }
                break;
            }

        }

        return this;
    }
}

其中，查找方法使用广度遍历，使用队列。

插入的时候，每次查找不再从树根开始查找，而是从找到的父目录的子树开始查找，效率比第一个函数方式要稍微高点。

虽然在这种简单的项目上，目录也不是很多，效率什么的并不明显，但是能考虑的地方就要多考虑考虑。

刚才说过了，不能使用二叉树，那么多叉树，也能用图进行抽象。但是图有个问题是，不好处理层级之间的关系，也就作罢。

就先这样吧，仓促之余先写这么多，等有时间再想想有没有其他更好的方法。

前端开发视角看数据结构-记一次项目中数据结构的选择
最近在写一个博客的小项目，对接github的钩子，当提交markdown工程至github时，通过设置github...
2019-07-01
作为一个开发人员，无论是前端还是后端，基础的数据结构知识是必要的。本文主要是说在前端中经常使用的数据结构及相...
安卓中扩展数据结构的探究解析
数据结构是编程工作的一项基本功，虽然现在很多应用程序的开发工作不会涉及数据结构的设计和实现，但是往往绕不开数据结构...
《大话数据结构》第一，二章
数据结构相关概念数据数据对象数据元素数据项1 数据项2 数据结构数据结构分类逻辑结构物理结构（存储结...
基础定义
一、数据结构 1.1 定义数据项——>数据元素——>数据对象——>数据数据对象+结构——>数据结构数据结构包...
数据结构与算法学习-001(基本概念)
一、基础知识数据结构常用术语：数据结构中最基本的5个概念: 数据,数据元素,数据项,数据对象,数据结构;数据结构...
非常心仪的某大公司的招聘要求，该如何具体的解读这个要求？
这其实是一个前端开发职业解读的问题，第2条扎实的计算机基础，对数据结构和算法有一定的了解怎么算是把数据结构、...
经典编程书籍大全
100+ 经典技术书籍，涵盖：计算机系统与网络、系统架构、算法与数据结构、前端开发、后端开发、移动开发、数据库、测...
软件开发技术栈
记录软件开发相关技术，文章会逐渐完善。计算机基础数据结构与算法编译原理操作系统网络硬件软件开发前端...
如果有人让你推荐编程技术书，请叫他看这个列表
这个列表包括了 100多本经典技术书籍，涵盖：计算机系统与网络、系统架构、算法与数据结构、前端开发、后端开发、移动...