简介
# 关于NoSQL
Not Only SQL
- 非关系型的数据库
- 提倡运用非关系型的数据存储
优点
- 对数据库高并发读写
- 对海量数据的高效率存储和访问
- 对数据库的高可扩展性和高可用性
弱点
- 数据库事务一致性需求
- 数据库的写实时性和读实时性需求
- 对复杂的SQL查询,特别是多表关联查询的需求
# 关于MongoDB
- 由C++语言编写的,是一个基于分布式文件存储的开源数据库系统
- 在高负载的情况下,添加更多的节点,可以保证服务器性能
- 为WEB应用提供可扩展的高性能数据存储解决方案
- 将数据存储为一个文档,数据结构由键值(key=>value)对组成
- MongoDB 文档类似于 JSON 对象
- 字段值可以包含其他文档,数组及文档数组
# 特点
MongoDB 是一个面向文档存储的数据库,操作起来比较简单和容易
可在MongoDB记录中设置任何属性的索引
可以通过本地或者网络创建数据镜像,这使得MongoDB有更强的扩展性
如果负载的增加(需要更多的存储空间和更强的处理能力) ,它可以分布在计算机网络中的其他节点上这就是所谓的分片
支持丰富的查询表达式。查询指令使用JSON形式的标记,可轻易查询文档中内嵌的对象及数组
使用update()命令可以实现替换完成的文档(数据)或者一些指定的数据字段
Mongodb中的Map/reduce主要是用来对数据进行批量处理和聚合操作
- Map和Reduce
- Map函数调用emit(key,value)遍历集合中所有的记录,将key与value传给Reduce函数进行处理。
- Map函数和Reduce函数是使用Javascript编写的,并可以通过db.runCommand或mapreduce命令来执行MapReduce操作
GridFS是MongoDB中的一个内置功能,可以用于存放大量小文件
MongoDB允许在服务端执行脚本,可以用Javascript编写某个函数,直接在服务端执行,也可以把函数的定义存储在服务端,下次直接调用即可
MongoDB支持各种编程语言:RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言
# 适用场景
网站数据
- Mongo非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性
缓存
- 由于性能很高,Mongo也适合作为信息基础设施的缓存层
- 在系统重启之后,由Mongo搭建的持久化缓存层可以避免下层的数据源过载
大尺寸,低价值的数据
- 使用传统的关系型数据库存储一些数据时可能会比较昂贵, 在此之前,很多时候程序员往往会选择传统的文件进行存储
高伸缩性的场景
- Mongo非常适合由数十或数百台服务器组成的数据库
- Mongo包含对Map/Reduce的内置支持
用于对象及 JSON数据的存储
- Mongo的BSON数据格式非常适合文档化格式的存储及查询
# 不适用场景
高度事务性的系统
- 如银行或会计系统
- 传统的关系型数据库目前还是更适用于需要大量原子性复杂事务的应用程序
传统的商业智能应用
- 针对特定问题的BI数据库会对产生高度优化的查询方式
- 对于此类应用,数据仓库可能是更合适的选择
# 安装 MongoDB
# 使用Docker安装
#拉取镜像
docker pull mongo:latest
#创建和启动容器 在windows下,数据挂载在d盘 D:\dev\docker-volumes\mongodb\data\db
docker run -d --restart=always -p 27017:27017 --name my-mongo -v /d/dev/docker-volumes/mongodb/data/db:/data/db -d mongo
#进入容器
docker exec -it my-mongo/bin/bash
#使用MongoDB客户端进行操作
mongo
> show dbs #查询所有的数据库
admin 0.000GB
config 0.000GB
local 0.000GB
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 桌面客户端
https://www.mongobooster.com/downloads
# MongoDB 的概念解析
SQL术语/概念 | MongoDB术语/概念 | 解释/说明 |
---|---|---|
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | 表连接,MongoDB不支持 | |
primary key | primary key | 主键,MongoDB自动将_id字段设置为主键 |
# 数据库 database
一个mongodb中可以建立多个数据库,常用命令如下
# help
Help查看命令提示
db.help();
# use
切换/创建数据库,如果数据库不存在,则创建数据库,否则切换到指定数据库
use test
# show
查询所有数据库
show dbs;
# dropDatabase
删除当前使用数据库
db.dropDatabase();
# getName
查看当前使用的数据库
db.getName();
# stats
显示当前db状态
db.stats();
# version
当前db版本
db.version();
# getMongo
查看当前db的链接机器地址
db.getMongo〇;
# 文档 document
文档是一组键值 (key-value) 对 (即BSON) MongoDB 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别
下表列出了 RDBMS 与 MongoDB 对应的术语
RDBMS | MongoDB |
---|---|
数据库 | 数据库 |
表格 | 集合 |
行 | 文档 |
列 | 字段 |
表联合 | 嵌入文档 |
主键 | 主键 (MongoDB 提供了 key 为 _id ) |
注意
- 文档中的键/值对是有序的
- 文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)
- MongoDB区分类型和大小写
- MongoDB的文档不能有重复的键
- 文档的键是字符串,除了少数例外情况,键可以使用任意UTF-8字符
# 文档键命名规范
- 键不能含有\0 (空字符)
- 这个字符用来表示键的结尾
- 和$有特别的意义,只有在特定环境下才能使用
- 以下划线
_
开头的键是保留的(不是严格要求的)
# 集合
- 集合就是 MongoDB 文档组,类似于 RDBMS (关系数据库管理系统:Relational Database Management System)中的表格
- 集合存在于数据库中,集合没有固定的结构,在对集合可以插入不同格式和类型的数据,通常情况下插入集合的数据都会有一定的关联性
# createCollection
创建一个集合(table)
db.createCollection( "collName");
# getCollection
得到指定名称的集合(table )
db.getCollection("user");
# 数据类型
数据类型 | 描述 |
---|---|
String | 字符串 存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的 |
Integer | 整型数值 用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位 |
Boolean | 布尔值 用于存储布尔值(真/假) |
Double | 双精度浮点值。用于存储浮点值 |
Min/Max keys | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比 |
Arrays | 用于将数组或列表或多个值存储为一个键 |
Timestamp | 时间戳。记录文档修改或添加的具体时间 |
Object | 用于内嵌文档 |
Null | 用于创建空值 |
Symbol | 符号 该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言 |
Date | 日期时间 用UNIX 时间格式来存储当前日期或时间 可指定自己的日期时间:创建 Date 对象,传入年月日信息 |
Object ID | 对象 ID。用于创建文档的 ID |
Binary Data | 二进制数据 用于存储二进制数据 |
Code | 代码类型 用于在文档中存储 JavaScript 代码 |
Regular expression | 正则表达式类型 用于存储正则表达式 |