Search
Collection
Category
Tag
Blog

Tag

Explore by tags

All

30u30

ASR

ChatGPT

GNN

IDE

RAG

ai-agent

ai-api

ai-api-management

ai-client

ai-coding

ai-development

ai-framework

ai-image

ai-inference

ai-leaderboard

ai-library

ai-rank

ai-serving

ai-tools

ai-train

ai-video

ai-workflow

AIGC

alibaba

amazon

anthropic

audio

blog

book

chatbot

chemistry

claude

course

deepmind

deepseek

engineering

foundation

foundation-model

gemini

google

gradient-booting

grok

huggingface

LLM

math

mcp

mcp-client

mcp-server

meta-ai

microsoft

mlops

NLP

nvidia

openai

paper

physics

plugin

RL

science

translation

tutorial

vibe-coding

video

vision

xAI

xai

AIAny

Learn Anything about AI in one site.

support@aiany.app

Product

Search
Collection
Category
Tag

Resources

Blog

Company

Privacy Policy
Terms of Service
Sitemap

Copyright © 2025 All Rights Reserved.

GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism

2018

Yanping Huang, Youlong Cheng +9

This paper introduces GPipe, a model-parallelism library designed to train large neural networks efficiently using pipeline parallelism. It partitions models across accelerators, processes micro-batches in parallel, and supports synchronous gradient updates. GPipe enables near-linear scaling with the number of devices while maintaining model quality and training stability. It achieves state-of-the-art performance in large-scale image classification (AmoebaNet) and multilingual machine translation (6B parameter Transformer), demonstrating flexibility across tasks. Its impact lies in making massive model training more practical and accessible across diverse architectures without relying on high-speed interconnects or custom model designs.

foundation 30u30 paper engineering

Previous
1
Next