Neural Machine Translation

This is a PyTorch implementation of neural machine translation.

Requirements

PyTorch 0.2/0.3
Python 3.5/3.6
NumPy
NLTK

Models

The recurrent model is [1]. The encoder is a two-layer bidirectinoal GRU and the decoder is a single-layer unidirectional GRU. The attention is computed by a multi-layer perceptron.
The ConvS2S is proposed by [2], which uses entirely convolutional layers to encode and decode.
The Transformer is proposed by [3], which uses multi-head attention and position-wise feed-forward network in both encoder and decoder.
Hashed character n-gram embedding [4], which represents word by its character n-grams. Other procedures are the same.

Usage

Download dataset from WIT3.
Preprocess data

python preprocess.py data/en-de/train.tags.en-de.de data/en-de/train.tags.en-de.en \
    data/en-de/de.train data/en-de/en.train # parse raw data
python preprocess.py data/en-de/de.train data/en-de/de.vocab.p 3 # build source vocab
python preprocess.py data/en-de/en.train data/en-de/en.vocab.p 3 # build target vocab

Train models

python [train_rnn.py|train_cnn.py|train_attn.py] \
    data/en-de de en data/en-de/de.vocab.p data/en-de/en.vocab.p

Evaluate models

python eval.py data/en-de de en [rnn|cnn|attn] \
    data/en-de/de.vocab.p data/en-de/en.vocab.p ckpt/encoder ckpt/decoder

Results

Model Complexity

Model	#params(word/n-gram)
RNN	83,941,203 / 64,440,659
ConvS2S	74,432,474 / 54,931,930
Transformer	26,960,896 / 17,771,264

BLEU score

Model	beam=1	beam=3	beam=5
RNN(word)	7.3	8.6	8.8
RNN(n-gram)	4.0	4.6	4.8
ConvS2S(word)	14.2	17.2	17.8
ConvS2S(n-gram)	11.0	13.7	14.4
Transformer(word)	4.0	4.1	4.2
Transformer(n-gram)	4.1	4.3	4.2

Inference Speed

We test the inference efficiency with beam size 3 on Tesla K80 with 1 GPU card.

Model	#speed(sec)(word/n-gram)
RNN	0.36 / 0.39
ConvS2S	1.64 / 1.68
Transformer	0.49 / 0.51

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
.gitignore		.gitignore
README.md		README.md
bleu.py		bleu.py
config.py		config.py
dataset.py		dataset.py
decoders.py		decoders.py
demo.py		demo.py
embedding.py		embedding.py
encoders.py		encoders.py
eval.py		eval.py
modules.py		modules.py
preprocess.py		preprocess.py
train_attn.py		train_attn.py
train_cnn.py		train_cnn.py
train_rnn.py		train_rnn.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Neural Machine Translation

Requirements

Models

Usage

Results

Model Complexity

BLEU score

Inference Speed

References

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Neural Machine Translation

Requirements

Models

Usage

Results

Model Complexity

BLEU score

Inference Speed

References

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages