catalogue 1. 数据集 2. 模型设计 3. 训练 1. 数据集 0x1: IMDB影评数据 本数据库含有来自IMDB的25,000条影评,被标记为正面/负面两种评价 from keras.datasets import imdb (X_train, y_train), (X_test, y_test) = imdb.load_data(path="imdb_full.pkl", nb_words=None, skip_top=0, maxlen=None, test_split=0.1) seed=113, start_char=1, oov_char=2, index_from=3) 1. path:如果你在本机上已有此数据集(位于'~/.keras/datasets/'+path),则载入。否则数据将下载到该目录下 2. nb_words:整数或None,要考虑的最常见的单词数,任何出现频率更低的单词将会被编码到0的位置。 3. skip_top:整数,忽略最常出现的若干单词,这些单词将会被编码为0 4. maxlen:整数,最大序列长度,任何长度大于此值的序列将被截断 5. seed:整数,用于数据重排的随机数种子 6. start_char:字符,序列的起始将以该字符标记,默认为1因为0通常用作padding 7. oov_char:字符,因nb