Datasets:

Modalities:
Text
Formats:
json
Languages:
Chinese
Libraries:
Datasets
pandas
License:
parquet-converter commited on
Commit
d681104
·
1 Parent(s): 374cdb2

Update parquet files

Browse files
Belle_open_source_1M.json → BelleGroup--train_1M_CN/json-train.parquet RENAMED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:4688f959eb33f69f9c56fc5f8fe0c97a1afc4aba29467d3e3f11c4529c536b1b
3
- size 457769896
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:26e4a37ff79b6e72416776d8781f86cf00fe17c41c3370f09cb0f7dde17b220d
3
+ size 289837443
README.md DELETED
@@ -1,31 +0,0 @@
1
- ---
2
- license: gpl-3.0
3
- task_categories:
4
- - text2text-generation
5
- language:
6
- - zh
7
- size_categories:
8
- - 100K<n<1M
9
- ---
10
-
11
- ## 内容
12
- 包含约100万条由[BELLE](https://github.com/LianjiaTech/BELLE)项目生成的中文指令数据。
13
-
14
- ## 样例
15
- ```
16
- {
17
- "instruction": "给定一个文字输入,将其中的所有数字加1。\n“明天的会议在9点开始,记得准时到达。”\n",
18
- "input": "",
19
- "output": "“明天的会议在10点开始,记得准时到达。”"
20
- }
21
- ```
22
- ### 字段:
23
- ```
24
- instruction: 指令
25
- input: 输入(本数据集均为空)
26
- output: 输出
27
- ```
28
-
29
- ## 使用限制
30
- 仅允许将此数据集及使用此数据集生成的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。
31
- 本数据集不代表任何一方的立场、利益或想法,无关任何团体的任何类型的主张。因使用本数据集带来的任何损害、纠纷,本项目不承担任何责任。