什么是结构化、半结构化和非结构化数据?

①结构化数据:指关系模型数据,即以关系数据库表形式管理的数据,结合到典型场景中更容易理解,比如企业ERP、OA、HR里的数据。

②非结构化数据:指数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。如word、pdf、ppt及各种格式的图片、视频等。

③半结构化数据:指非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、E-mail等;

边缘计算节点加入技术方式

对于普通用户,边缘节点加入门槛要降低。我看现在的边缘计算节点套路是:

1、软硬件一套带走,好比把一个已经装机过的开机自启的电脑直接卖到用户家里,就用用户家里的电和网,通电自启。

2、基于各种虚拟机,但不包含docker!虚拟机内套娃docker,因为我们还需要有很多操作系统级别命令,比如kubeedge的join命名,虽然就一行,但是不同操作系统编译结果执行兼容性都很差。而用虚拟机快照,就要方便很多,甚至可以跑在苹果系统上。

3、docker in docker或者docker out docker,这个按说是一种完美的方案,但技术上试了几个都不给力,因为这种模式跟docker的设计背道而驰,有趣的是,官网出品的就可以,自己制作出来却不容易。可惜的是,官网的那个,docker镜像是基于arclinux的轻量级linux,导致很多指令和库不兼容kubeedge join操作。所以要么找一个兼容好的docker in docker底座,要么在arclinux上编译源码编译kubeedge适配。

Ubuntu 20.04 公网环境搭建k8s集群

系统:至少两台 Ubuntu 20.04

网络:公网IP

安装docker

需要在所有节点安装Docker

进入root用户

sudo -i

apt update

参考清华源教程,选择正确版本,我这里是选择Ubuntu安装docker

安装完成后使用镜像加速,以及配置 systemd 来管理 docker:

cat > /etc/docker/daemon.json <<EOF