Символьная отладка программ для микроконтроллеров.
За редким исключением, программы для микроконтроллеров (МК) не начинают работать с первого раза из-за содержащихся в них ошибок. Если программа достаточно сложная, то исправить ошибки без отладочных средств бывает достаточно трудно или даже невозможно, поэтому все разработчики устройств, содержащих микроконтроллеры, применяют те или иные приемы, позволяющие отлаживать программы. Разработчики по-разному относятся к вопросам отладки программ. Встречаются, хотя и редко, такие, кто заявляет, что вообще не нуждается в отладочных средствах, что достаточно внимательно проанализировать исходный текст, посмотреть с помощью осциллографа, что происходит на выводах МК, и можно исправить все ошибки. Такой способ отладки применим, если у разработчика есть большой опыт, отличное знание применяемого микроконтроллера, транслятор, который всегда генерирует правильный код (обычно это ассемблер), и достаточное количество времени.
Другие разработчики применяют для отладки программ самодельные отладочные мониторы. Отладочный монитор - это набор отладочных подпрограмм, загружаемых в МК вместе с основной программой. Основная программа вызывает в контрольных точках подпрограммы отладочного монитора, а те могут тем или иным способом выдать информацию о состоянии ресурсов МК разработчику. Так можно отладить практически любую программу, но у отладки с помощью монитора есть недостатки, которые могут оказаться существенными. Во-первых, отладочному монитору необходимо предоставить для работы часть ресурсов МК: как минимум - часть адресного пространства кода и некоторое количество ячеек стека, как максимум - еще и часть ОЗУ и периферийные устройства МК, используемые монитором для отображения информации. Выделить достаточные ресурсы отладочному монитору бывает непросто, если основная программа сама активно загружает МК. Например, у МК PIC 16C5x семейства Microchip PIC всего две ячейки стека, и использовать вызовы подпрограмм отладочного монитора затруднительно. Во-вторых, вызовы монитора отнимают время у основной программы и, следовательно, отладочный монитор нельзя вызывать из критичных ко времени частей программы. В-третьих, создание отладочного монитора само по себе требует времени.
Самый эффективный способ отладки программ для МК - применение специализированных, профессиональных отладочных средств, к которым следует отнести отладчики-симуляторы и внутрисхемные эмуляторы.
Прежде чем рассказывать о возможностях, предоставляемых профессиональными отладчиками, необходимо коснуться выбора компилятора, с помощью которого исходные тексты программ преобразуются в машинный код. В подавляющем большинстве случаев предпочтительным является программирование на языке высокого уровня (обычно это Си). Использование чистого ассемблера необходимо только в том случае, если к размеру и быстродействию генерируемого кода предъявляются очень жесткие требования. В настоящее время таких случаев становится все меньше, так как всегда можно взять более быстрый МК с большим объемом памяти. Кроме того, современные пакеты кросс-средств позволяет легко писать смешанные программы, где часть модулей написана на Си, а наиболее критичные к быстродействию части - на ассемблере.
Компиляторы Си позволяют также вставлять в исходные тексты ассемблерные инструкции.
Перечислим вкратце преимущества программирования на Си по сравнению с программированием на ассемблере.
- отпадает необходимость заботиться об операциях с числами большой разрядности. Компилятор автоматически сгенерирует правильный код для операции "a+b", если a и b будут 8-, 16-, 32-битными числами, числами с плавающей точкой и даже числами разных типов;
- в комплекте с компилятором поставляется обширная библиотека функций (подпрограмм), реализующих различные математические операции (тригонометрические функции, возведение в степень и т.п.), работу с символьными строками, форматированный ввод/вывод и т.д.;
- многие ошибки программиста диагностируются компилятором. Компилятор не позволит, например, передать функции неверное число параметров или параметры неверных типов, забыть поставить оператор возврата и т.п.;
- исходный текст, написанный на Си, гораздо легче читается, он компактнее, легче модифицируется;
- программы, написанные на Си, легче переносятся на МК других семейств. Чтобы эффективно отлаживать программы, написанные на языке высокого уровня, разработчик должен иметь в своем распоряжении отладочные средства, предоставляющие адекватные возможности по отображению используемых в программе данных, а также по отслеживанию выполнения программы по ее исходному тексту. Для обеспечения таких возможностей необходимы два условия:
1. Компилятор должен предоставлять достаточную информацию о структуре программы и используемых ею данных. Эту информацию называют "символьной (отладочной)" информацией.
2. Отладчик должен уметь интерпретировать эту информацию. Все современные компиляторы и ассемблеры в том или ином виде генерируют символьную информацию, но в настоящее время еще не разработано ее универсального формата, и каждый компилятор генерирует ее в собственном формате. Это создает дополнительные трудности для отладчиков, которые должны уметь "понимать" несколько символьных форматов.
Теперь рассмотрим, как отладчик должен интерпретировать символьную информацию и какие возможности должны в связи с этим предоставляться пользователю.
Отслеживание выполнения программы по ее исходному тексту. В общем случае, одна строка исходного текста преобразуется компилятором в несколько машинных команд. Даже ассемблерная программа почти всегда содержит макросы, разворачивающиеся при трансляции в несколько инструкций процессора. Отлаживать такую программу по дисассемблеру ее кода неудобно, поэтому компиляторы вставляют в отладочную информацию таблицу номеров строк. Таблица содержит информацию о соответствии номеров строк исходного текста и имен файлов исходного текста абсолютным адресам кода программы. Отладчик отображает на экране исходный текст программы, и, следуя этой таблице, может выполнять программу "по строкам", выполняя за один шаг все машинные команды, сгенерированные компилятором для текущей строки. Таблица номеров строк позволяет также производить контекстные действия с текстом программы, например, выполнять программу "до курсора", т.е. до указанного пользователем места в исходном тексте, ставить точки останова на указанные строки и т.п. Контекстные действия удобны тем, что разработчикам не нужно знать соответствующие строкам исходного текста адреса: отладчик сам определит их по таблице. Отладчик должен также знать адреса подпрограмм, функций и меток кода, и уметь находить исходный текст функции по ее имени.
Отображение данных, использующихся в отлаживаемой программе.
Для полноценной отладки разработчику необходимо иметь возможность в любой момент просмотреть данные, которыми манипулирует программа. Отладчик должен уметь отображать любые используемые программой данные в наиболее подходящем виде.
Как правило, разработчики используют в программах именованные данные, т.е. каждому объекту, который используется в программе, присваивается имя. Объекты могут быть разной сложности - от простых ячеек памяти до сложных конструкций языков высокого уровня типа структур, массивов и т.п.
Данные в ассемблерных программах.
В ассемблерных программах используются в основном простые данные, т.е. ячейки памяти. Применяются также массивы. Для правильного отображения простых данных отладчику нужно знать:
1. Имя объекта
2. Адрес объекта в памяти
3. Адресное пространство МК, в котором располагается объект. Многие МК имеют более одной области данных. Например, в МК семейства MCS-51 есть внутренняя память данных, внешняя память данных и битовое пространство.
4. Разрядность объекта, т.е. количество байт, занимаемое объектом. 16-битные МК, такие, как представители MCS-96, умеют оперировать 8-, 16-, 32-битными данными.
Здесь необходимо отметить один существенный момент. Для разработчика важно, какой логический размер имеет объект. Например, МК семейства Microchip PIC имеют 8-разрядную архитектуру и оперируют только байтами. Если разработчику необходимо иметь в программе, например, 16-битный счетчик, то манипулировать каждым байтом приходится по отдельности. Но программисту при отладке хотелось бы видеть не каждый байт счетчика по отдельности, а оба байта сразу, в виде 16-битной переменной. Популярные кросс-ассемблеры не предоставляют такой возможности. Исключение составляет PASM-PIC фирмы "Фитон", который позволяет объявлять в программе данные размером байт, слово, двойное слово, а также массивы таких объектов. При отладке программ, написанных с помощью PASM-PIC , все объекты отображаются в виде, соответствующем их логическому размеру и структуре.
5. Область видимости объекта. При модульном программировании, когда программа состоит из нескольких модулей, у программиста есть возможность локализовать область видимости имени в пределах одного модуля. Таким образом, в разных модулях могут существовать объекты с одинаковыми именами, но разными остальными атрибутами. Отладчик должен разбираться, когда какой объект "активен", и правильно отображать его. Заметим, однако, что практика использования одинаковых имен в разных модулях часто приводит к путанице и ошибкам. В случае, когда объект объявлен глобальным (PUBLIC) и виден во всех модулях, трудностей с интерпретацией не возникает.
Обладая вышеизложенной информацией, отладчик должен, получив от пользователя имя объекта, отобразить его значение в соответствии с типом. Наиболее продвинутые отладчики дополнительно могут отображать остальные атрибуты объекта.
Данные в программах языков высокого уровня.
Отображать объекты, применяемые в языках высого уровня, значительно сложнее ввиду разнообразия структуры объектов, способов их размещения в памяти и областей видимости. Для примеров будем использовать язык Си, как наиболее популярный у разработчиков.
Структура объектов.
Помимо простых переменных разной разрядности, в Си-программах используются также переменные с плавающей точкой, структуры (struct), объединения или союзы (union), указатели, одномерные и многомерные массивы. Массивы могут состоять как из простых объектов, так и из сложных (структур, союзов, указателей).
Использование сложных объектов в программах, безусловно, удобно. Однако, ввиду сложности структуры объектов, крайне желательно иметь возможность ее адекватного отображения на этапе отладки. В отладчиках фирмы "Фитон" сложные объекты могут отображаться как в сжатом (список значений элементов), так и в развернутом виде с указанием адреса, значения и типа каждого элемента массива и/или члена структуры. Реализация указателей в разных компиляторах различна. То, что МК обычно имеет несколько адресных пространств, создает дополнительные трудности, т.к. при работе с указателем должно быть известно, помимо адреса, и адресное пространство, куда указывает указатель. В некоторых реализациях идентификатор адресного пространства является составной частью значения указателя, в других компилятор заранее "знает" это и генерирует соответствующий код. Кроме этого, компонента адреса в указателе может быть размером от 8 до 32 бит. При отображении значений указателей отладчик должен знать все детали их реализации в каждом компиляторе.
Способы размещения объектов в памяти.
Помимо статических объектов, адрес которых не изменяется за время выполнения программы, в программе, написанной на языке высокого уровня, могут существовать так называемые автоматические объекты, память под которые временно отводится в стеке МК. Адреса автоматических объектов не абсолютны, а определяются динамически на этапе выполнения программы. Обычно эти адреса отсчитываются от текущего значения некоторой статической переменной, называемой указателем фрейма стека (Base Pointer, BP). Так как значение указателя фрейма стека формируется программой динамически на этапе выполнения, то значения автоматических объектов доступны только в пределах их области видимости, т.е. при правильном значении указателя фрейма стека. Отладчик при отображении значений автоматических объектов должен "знать" способ, которым определяются адреса, а также отслеживать правильность значения BP.
Возможно также временное размещение переменных в регистрах МК. В этом случае отладчик должен знать", какие переменные в каких регистрах размещены и в течение какого времени. И, наконец, часто встречается ситуация, когда один и тот же объект за время своей жизни меняет способ размещения в памяти, причем не один раз. Это может происходить, например, когда функция получает один или несколько параметров в регистрах, а затем перемещает их в стек.
Область видимости объекта.
Как и в ассемблерных программах, в программах, написанных на Си, существуют глобальные объекты, доступные по имени из любого модуля, и объекты, локальные в модуле (эти объекты объявляются как "static"). Однако, автоматические и регистровые переменные создают отладчикам дополнительные трудности при отображении их значений. Дело в том, что, во-первых, время жизни автоматического объекта ограничено его областью видимости, а во-вторых, охватывающие области видимости могут иметь свои автоматические объекты с теми же именами. Проиллюстрируем это на примере функции, имеющей несколько вложенных областей видимости:
void f(int a)
{
long b;
if (a == 0) a++;
for (b = a * 2; b < 100; b++)
{
long c;
long a = b / 3;
if (a == 0) a++;
for (c = a; c < 10; c++)
{
char a = c == 9? 1 : 0;
f1(a);
}
f2(a);
}
f3(a);
}
|
Переменная с именем "a" существует все время, пока выполняется функция f, но в зависимости от того, какая часть функции выполняется, имя "a" обозначает разные переменные. При трассировке функции f отладчик должен в зависимости от того, какая переменная "активна", правильно показывать ее значение.
Создавая программу, разработчик не заботится о деталях реализации понятий, которые он использовал в программе. Оперируя "само собой разумеющимися" категориями, разработчики зачастую не подозревают, как сложно было реализовать их разработчикам компиляторов и отладчиков. Разработчикам последних приходится решать задачи совмещения в одной оболочке одновременно простого и интуитивного интерфейса, богатства функциональных возможностей и детальной проработки всего, что связано с реализацией особенностей архитектуры и функционирования конкретного МК. Если отладчик не предоставляет разработчику средств отладки, адекватных сложности решаемой задачи, то разработчик неизбежно теряет в производительности. Кому из нас не приходилось тратить часы и дни в поисках собственной опечатки в исходном тексте?!
|