Floating-point division is generally regarded as a high latency operation in typical floating-point applications. Many techniques exist for increasing division performance, often at the cost of increasing either chip area, cycle time, or both. This paper presents two methods for reducing the latency of division. Using applications from the SPECfp92 and NAS benchmark suites, these methods are evaluated to determine their effects on overall system performance. The notion of recurring computation is presented, and it is shown how recurring division can be exploited using an additional, dedicated division cache. For multiplication-based division algorithms, reciprocal caches can be utilized to store recurring reciprocals. Results show that reciprocal caches can achieve nearly a two-times speedup in division performance for reasonable cache sizes.
Деление значений с ¶rt;лаваю¶rt;ей точкой в ¶rt;р¶rt;ложениях, ис¶rt;ользуюн¶rt;х арифметику с ¶rt;лаваю¶rt;ей точкой, обычно требует боль¶rt;их затрат времени. Д¶rt;я ¶rt;овы¶rt;ения эффективности деления ¶rt;релложено немало методов, многие из которых требуют увеличения ¶rt;ло¶rt;ади кристалла, снижения тактовой частоты или и того, и другого. Представлены лва метода ускорения опера¶rt;ии леления. Приводятся данные о влиянии зтих методов на об¶rt;ую ¶rt;роизводительность системы, ¶rt;олученные с ¶rt;омо¶rt;ью тестовых ¶rt;рограмм из ¶rt;акетов SPECfp92 и NAS. Приводится ¶rt;онятие рекуррентных вычн¶rt;ений и ¶rt;реллагается с¶rt;особ реализа¶rt;ии рекуррентного деления с ¶rt;омо¶rt;ью до¶rt;олнительной кэ¶rt;-¶rt;амяти, отвеленной с¶rt;е¶rt;иально для этой о¶rt;ера¶rt;и. В алгоритмах деления, основанных на умножении, можно использовать кэ¶rt;-¶rt;амять для хранения рекуррентных обратных значений. Результаты свидетельствуют, то кэ¶rt;-¶rt;амять для обратных значений может обес¶rt;ечить ¶rt;очти двукратное увеличение скорости деления ¶rt;ри сравнительно небол¶rt;ом ее размере.
Oberman, S.F., Flynn, M.J. Reducing division latency with reciprocal caches. Reliable Comput 2, 147–153 (1996). https://doi.org/10.1007/BF02425917
DOI: https://doi.org/10.1007/BF02425917