Huawei präsentiert mit Ascend 910 den leistungsfähigsten KI- Prozessor
26. August 2019Huawei präsentiert mit Ascend 910 den leistungsfähigsten KI- Prozessor
Peking, 26. August 2019
Huawei hat offiziell den weltweit leistungsfähigsten KI-Prozessor, den Ascend 910, sowie ein szenarioübergreifendes KI-Computing-Framework, MindSpore, vorgestellt.
„Wir haben seit der Ankündigung unserer KI-Strategie im Oktober letzten Jahres kontinuierliche Fortschritte gemacht“, sagte Eric Xu, Huawei’s rotierender Vorsitzender.
„Von der Forschung und Entwicklung bis zur Produkteinführung schreitet alles nach Plan voran. Wir haben ein Full-Stack- und All-Scenario-KI-Portfolio versprochen. Und heute haben wir mit der Veröffentlichung von Ascend 910 und MindSpore geliefert. Damit wird auch eine neue Etappe in der KI-Strategie von Huawei eingeleitet.“
Der Ascend 910 ist ein neuer KI-Prozessor, der zur Huawei Ascend-Max-Chipsatzreihe gehört. Huawei kündigte die geplanten Spezifikationen des Verarbeiters auf seiner Leitveranstaltung Huawei Connect 2018 an.
Nach einem Jahr kontinuierlicher Weiterentwicklung zeigen die Testergebnisse nun, dass der Ascend 910 Prozessor seine Leistungsziele bei deutlich geringerem Stromverbrauch als ursprünglich geplant erreicht.
Für halbpräzise Gleitkommaoperationen (FP16) liefert Ascend 910 256 TeraFLOPS.
Für Ganzzahlige Genauigkeitsberechnungen (INT8) liefert es 512 TeraOPS. Trotz seiner konkurrenzlosen Leistung beträgt die maximale Leistungsaufnahme des Ascend 910 nur 310 W und liegt damit deutlich unter den geplanten Spezifikationen (350 W).
„Ascend 910 schneidet viel besser ab, als wir erwartet haben“, sagte Xu. „Ohne Zweifel hat er mehr Rechenleistung als jeder andere KI-Prozessor der Welt.“
Ascend 910 wird für das KI-Modelltraining verwendet. In einer typischen Trainingseinheit auf Basis von ResNet-50 ist die Kombination von Ascend 910 und MindSpore beim Training von KI-Modellen etwa zwei Mal schneller als bei anderen Mainstream-Trainingskarten mit TensorFlow.
In Zukunft wird Huawei weiterhin in KI-Prozessoren investieren, um eine reichlich vorhandene, erschwingliche und anpassbare Rechenleistung bereitzustellen, die den Anforderungen einer Vielzahl von Szenarien gerecht wird (z.B. Edge Computing, On-Vehicle-Computing für autonomes Fahren und Training).