Ю.М. Баяковский, А.В. Игнатенко - Начальный курс OpenGL (DOC) (1124366), страница 12
Текст из файла (страница 12)
9.1.1. Высокоуровневая оптимизация
Обычно от программы под OpenGL требуется визуализация высокого качества на интерактивных скоростях. Но как правило, и то и другое сразу получить не удается. Следовательно, необходим поиск компромисса между качеством и производительностью. Существует множество различных подходов, но их подробное описание выходит за пределы этого пособия. Приведем лишь несколько примеров.
• Можно отображать геометрию сцены с низким качеством во время анимации, а в моменты остановок показывать ее с
115
116
Глава 9. Оптимизация программ
наилучшим качеством. Во время интерактивного вращения (например, при нажатой клавише мыши) визуализировать модель с уменьшенным количеством примитивов. При рисовании статичного изображения отображать модель полностью.
• Аналогично, объекты, которые располагаются далеко от наблюдателя, могут быть представлены моделями пониженной сложности. Это значительно снизит нагрузку на все ступени конвейера OpcnGL. Объекты, которые находятся полностью вне поля видимости, могут быть эффективно отсечены без передачи на конвейер OpcnGL с помощью проверки попадания ограничивающих их простых объемов (сфер или кубов) в пирамиду зрения.
9.1.2. Низкоуровневая оптимизация
Объекты, отображаемые с помощью OpenGL, хранятся в некоторых структурах данных. Одни типы таких структур более эффективны в использовании, чем другие, что определяет скорость визуализации.
Желательно, чтобы использовались структуры данных, которые могут быть быстро и эффективно переданы на конвейер OpenGL. Например, если мы хотим отобразить массив треугольников, то использование указателя на этот массив значительно более эффективно, чем передача его OpenGL поэлементно.
Пример. Предположим, что мы пишем приложение, которое реализует рисование карты местности. Один из компонентов базы данных — список городов с их шириной, долготой и названием. Соответствующая структура данных может быть такой:
struct city
{
float latitute , longitude; /* положение города */
char *name; /* название */
9.1. Организация приложения
117
int large_flag; /* 0 = маленький, 1 = большой */
};
Список городов может храниться как массив таких структур. Допустим, мы пишем функцию, которая рисует города на карте в виде точек разного размера с подписями:
void draw_cities( int n, struct city citylist [] )
{
int i ;
for (i=0; i < n; i++)
{
if ( citylist [ i ]. large_flag)
glPointSize( 4.0 ); else
glPointSize( 2.0 );
glBegin( GL_POINTS );
glVertex2f( citylist [ i ] . longitude ,
city list [ i ]. latitude ); glEnd();
/* рисуем название, города */ DrawText ( citylist [ i ] . longitude , citylist [ i ] . latitude , citylist [ i ] . name); } }
Эта реализация неудачна по следующим причинам:
-
glPointSize вызывается для каждой итерации цикла;
-
между glBegin и glEnd рисуется только одна точка;
-
вершины определяются в неоптимальном формате.
Ниже приведено более рациональное решение:
void draw_cities( int n, struct city citylist [] ) {
118
Глава 9. Оптимизация программ
}
int i ;
/* сначала рисуем маленькие точки */ glPointSize( 2.0 ); glBegin( GL_POINTS ); for ( i=0; i < n ; i++)
{
if ( city list [ i ]. large_flag==0) {
glVertex2f( citylist [ i ] . longitude , city list [ i ]. latitude ); } }
glEnd();
/* большие точки рисуем во вторую очередь */ glPointSize( 4.0 ); glBegin( GL_POINTS ); for ( i=0; i < n ; i++)
{
if ( city list [ i ]. large_flag==l)
{
glVertex2f( citylist [ i ] . longitude , city list [ i ]. latitude ); } } glEnd();
/* затем рисуем названия городов */ for ( i=0; i < n ; i++)
{
DrawText ( citylist [ i ] . longitude ,
citylist [i]. latitude ,
citylist [i]. name ) ; }
В такой реализации мы вызываем glPointSize дважды и увеличиваем число вершин между glBegin и glEnd.
Однако остаются еще пути для оптимизации. Если мы поме-
9.1. Организация приложения
119
няем наши структуры данных, то можем еще повысить эффективность рисования точек. Например:
struct city list
{ _
int num_cities; /* число городов в списке */
float ^position;/* координаты города */
char **name; /* указатель на названия городов */
float size ; /* размер точки, обозначающей город */
};
Теперь города разных размеров хранятся в разных списках. Положения точек хранятся отдельно в динамическом массиве. После реорганизации мы исключаем необходимость в условном операторе внутри glBegin/glEnd и получаем возможность использовать массивы вершин для оптимизации. В результате наша функция выглядит следующим образом:
void draw_cities( struct city list * 1 i s t )
{
int i ;
/* рисуем точки */ glPointSize( list —>size );
glVertexPointer( 2, GL_FLOAT, 0,
list —>num_cities ,
list —>position ) ; glDrawArrays( GL_POINTS, 0, list->num_cities ); /* рисуем название города */ for (i=0; i < list —>num_cities ; i++)
{
DrawText( citylist [ i ] . longitude , citylist [ i ] . latitude citylist [i].name); } }
120
Глава 9. Оптимизация программ
9.2. Оптимизация вызовов OpenGL
9.2.1. Передача данных в OpenGL
В данном разделе рассмотрим способы минимизации времени на передачу данных о примитивах в OpenGL.
Используйте связанные примитивы
Связанные примитивы, такие как GL_LINES, GL_LINE_LOOP, GL_TRIANGLE_STRIP, GL_TRIANGLE_FAN и GL_QUAD_STRIP требуют для определения меньше вершин, чем отдельные линия или многоугольник. Это уменьшает количество данных, передаваемых OpenGL.
Используйте массивы вершин
На большинстве архитектур замена множественных вызовов glVertex/glColor/glNormal на механизм массивов вершин может быть очень выигрышной.
Используйте индексированные примитивы
В некоторых случаях даже при использовании связанных примитивов GL_TRIANGLE_STRIP (GL_QUAD_STRIP) вершины дублируются. Чтобы не передавать в OpenGL дубли, увеличивая нагрузку на шину, используйте команду glDrawElementsQ.
Задавайте необходимые массивы одной командой
Вместо использования команд glVertexPointer, glColorPointer, glNormalPointer лучше пользоваться одной командой
void glinterleavedArrays ( Glint format,
Glsizei stride , void * ptr);
9.2. Оптимизация вызовов OPENGL
121
Так, если имеется структура
typedef struct tag_VERTEX_DATA
{
float color [4];
float normal [3]; float vertex [3]; }VERTEX_DATA; VERTEX_DATA * pData;
то параметры можно передать с помощью следующей команды gllnterleavedArrays (GL_C4F_N3F_V3F, 0, pData);
что означает, что первые четыре float относятся к цвету, затем три float к нормали, и последние три float задают координаты вершины. Более подробное описание команды смотрите в спецификации OpenGL.
Храните данные о вершинах в памяти последовательно
Последовательное расположение данных в памяти улучшает скорость обмена между основной памятью и графической подсистемой.
Используйте векторные версии glVertex, glColor, glNormal и glTexCoord.
Функции glVertex, glColor и т.д., которые в качестве аргументов принимают указатели (например, glVertex3fv(v)), могут работать значительно быстрее, чем их соответствующие версии glVertex3f(x,y,z).
Уменьшайте сложность примитивов
Во многих случаях будьте внимательны, чтобы не разбивать большие плоскости на части сильнее, чем необходимо. Поэкспериментируйте, например, с примитивами GLU для определения наилучшего соотношения качества и производительности.
122
Глава 9. Оптимизация программ
Текстурированные объекты, например, могут быть качественно отображены с небольшой сложностью геометрии.
Используйте дисплейные списки
Используйте дисплейные списки для наиболее часто выводимых объектов. Дисплейные списки могут храниться в памяти графической подсистемы и, следовательно, исключать частые перемещения данных из основной памяти.
Не указывайте ненужные атрибуты вершин
Если освещение выключено, не вызывайте glNormal. Если не используются текстуры, не вызывайте glTexCoord, и т.д.
Минимизируйте количество лишнего кода между операторными скобками glBegin/glEnd
Для максимальной производительности на high-end системах важно, чтобы информация о вершинах была передана графической подсистеме максимально быстро. Избегайте лишнего кода между glBegin/glEnd.
Пример неудачного решения:
g 1В е g i n (GL_TRIANGLE_STRIP); for (i=0; i < n; i++)
{
if (light ing )
{
glNormal3fv (norm [ i ]) ;
}
glVertex3fv(vert [i ]) ;
}
glEnd();
9.2. Оптимизация вызовов OPENGL
123
Эта конструкция плоха тем, что мы проверяем переменную lighting перед каждой вершиной. Этого можно избежать, за счет частичного дублирования кода:
if (lighting )
{
glBegin (GL_TRIANGLE_STRIP);
for (i=0; i < n ; i++)
{
glNormal3fv (norm [ i ]) ; glVertex3fv(vert [i ]) ;
}
glEnd();
} else
{
glBegin (GL_TRIANGLE_STRIP);
for (i=0; i < n ; i++)
{
glVertex3fv(vert [i ]) ;
} glEnd();
}
9.2.2. Преобразования
Преобразования включают в себя трансформации вершин от координат, указанных в glVertex, к оконным координатам, отсечение, освещение и т.д.
Освещение
-
Избегайте использования точечных источников света.
-
Избегайте использования двухстороннего освещения (two-sided lighting).
124
Глава 9. Оптимизация программ
-
Избегайте использования локальной модели освещения.
-
Избегайте частой смены параметра GL_SHININESS.
-
Рассмотрите возможность заранее просчитать освещение. Можно получить эффект освещения, задавая цвета вершин вместо нормалей.
Отключайте нормализацию векторов нормалей, когда это не является необходимым
Команда glEnable/Disable(GL_NORMALIZE) управляет нормализацией векторов нормалей перед использованием. Если вы не используете команду glScale, то нормализацию можно отключить без посторонних эффектов. По умолчанию эта опция выключена.
Используйте связанные примитивы
Связанные примитивы, такие как GL_LINES, GL_LINE_LOOP, GL_TRIANGLE_STRIP, GL_TRIANGLE_FAN, и GL_QUAD_STRIP уменьшают нагрузку на конвейер OpenGL, а также уменьшают количество данных, передаваемых графической подсистеме.
9.2.3. Растеризация
Растеризация часто является узким местом программных реализаций OpenGL.
Отключайте тест на глубину, когда в этом нет необходимости
Фоновые объекты, например, могут быть нарисованы без теста на глубину, если они визуализируется первыми.
9.2. Оптимизация вызовов OPENGL
125
Используйте отсечение обратных граней полигонов
Замкнутые объекты могут быть нарисованы с установленным режимом отсечения обратных граней glEnable(GL_CULL_FACE) Иногда это позволяет отбросить до половины многоугольников, не растеризуя их.
Избегайте лишних операций с пикселями
Маскирование, альфа-смешивание и другие попикссльныс операции могут занимать существенное время на этапе растеризации. Отключайте все операции, которые вы не используете.
Уменьшайте размер окна или разрешение экрана
Простой способ уменьшить время растеризации — уменьшить число пикселей, которые будут нарисованы. Если меньшие размеры окна или меньшее разрешение экрана приемлемы, то это хороший путь для увеличения скорости растеризации.
9.2.4. Текстурирование
Наложение текстур является дорогой операцией, как в программных, так и в аппаратных реализациях.
Используйте эффективные форматы хранения изображений
Формат GL_UNSIGNED_BYTE обычно наиболее всего подходит для передачи текстуры в OpenGL.
Объединяйте текстуры в текстурные объекты или дисплейные списки.
Это особенно важно, если вы используете несколько текстур, и позволяет графической подсистеме эффективно управлять
126
Глава 9. Оптимизация программ
размещением текстур в видеопамяти.
Не используйте текстуры большого размера
Небольшие текстуры быстрее обрабатываются и занимают меньше памяти, что позволяет хранить сразу несколько текстур в памяти графической подсистемы.
Комбинируйте небольшие текстуры в одну
Если вы используете несколько маленьких текстур, то можно объединить их в одну большего размера и изменить текстурные координаты для работы с нужной подтекстурой. Это позволяет уменьшить число переключений текстур.