Micro #09
04 октября 1998
  TR-DOS  

Tape и Disk - Адаптация программ к системе TR-DOS (часть 3).

<b>Tape и Disk</b> - Адаптация программ к системе TR-DOS (часть 3).
┌───────────────────────────────────────┐
│  Адаптация программ к системе TR-DOS  │▒
└───────────────────────────────────────┘▒
  ▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒▒

                 ГЛАВА 3
        =========================
          =   ЕЩЕ О БЕЙСИКЕ   =

   Программист,  не знакомый с представле-
нием  чисел бейсик-интерпретатором компью-
тера  ZX Spectrum,  немало удивится, стол-
кнувшись со следующей программой:

  10 CLEAR 100
  20 PAPER 27: INK 8E-12: BORDER 65536:CLS
  30 PRINT AT -10000,22E22;"PLEASE WAIT"
  40 LOAD ""CODE 0,0
  50 RANDOMIZE USR 0

   Такой  программист  будет  настоятельно
утверждать,что этот бред написан не иначе,
как пациентом психиатрического учреждения,
до тех пор,  пока не запустит  программу и
не  увидит результаты ее работы.  Что про-
изойдет с программистом после того,  как в
середине  экрана  появится надпись  PLEASE
WAIT,  затем загрузится и запустится игра,
предсказать  трудно.   Вероятнее всего, он
побежит  в ПНД с предполагаемым  диагнозом
"маниакально-депрессивный  психоз на почве
программирования".
   Для того чтобы с Вами  этого не произо-
шло, раскрою Вам одну тайну.  Все  дело  в
том, что при обработке чисел бейсик-интер-
претатор использует два их представления.
первое  представление ─ это  приятная  для
глаз  символьная  форма,  в  которой число
16389, например, будет записано пятью бай-
тами согласно таблице ASCII.  Однако такая
форма  относительно  долго  обрабатывается
бейсик-интерпретатором,   посему для своих
нужд  он использует  другое  представление
числа ─ двоичное.    Двоичная форма числа,
предваряемая  префиксом ─ кодом  14 (0Eh),
хранится  в  памяти  непосредственно после
символьной формы.   Число 16389, например,
выглядит в памяти следующим образом:

    │символьная форма│пре-│ двоичная │
    │ 1  6  3  8  9  │фикс│  форма   │
────┼──┬──┬──┬──┬────┼────┼─┬─┬─┬──┬─┼────
 ...│49│54│51│56│57  │ 14 │0│0│5│64│0│...
────┴──┴──┴──┴──┴────┴────┴─┴─┴─┴──┴─┴────

   Отсюда видно, что двоичная  форма числа
занимает 5 байт  плюс  байт префикса.  При
записи целых констант в промежутке от 0 до
65535 "значащими" являются 3-й и 4-й байты
после префикса.В этом случае двоичную фор-
му числа можно первести в десятичную с по-
мощью оператора

  PRINT PEEK (n+3)+256*PEEK (n+4)

- где n ─ адрес, по которому хранится байт
префикса.
   Двоичная и символьная  формы числа  су-
ществуют  параллельно.  При выполнении ин-
струкций бейсик-интерпретатор руководству-
ется  только  двоичной  формой, символьная
форма  его  не интересует, она сохраняется
ради  удобочитаемости  программ.   Поэтому
"порча"  символьного  представления  чисел
приводит в ужасный вид  листинг программы,
но не влияет на её работоспособность.
   Двоичная форма числа  добавляется в мо-
мент проверки синтаксиса строки,то есть по
окончании  набора  строки и нажатии Enter.
При  вызове на редактирование  строки дво-
ичная  форма удаляется, а после ввода  ис-
правленной строки  восстанавливается в со-
ответствии с новой редакцией.
   Из сказанного  должно быть понятно, что
загадочная программа, приведенная в начале
этой  главы,  не будет  работать,  если её
ввести  с клавиатуры  обычным способом, не
используя  каких-либо  специальных приёмов
(быть может, Вы уже пробовали её набрать и
запустить и решили, что не кто иной,как я,
и являюсь пациентом вышеуказанной клиники)
   Для того,чтобы привести программу к та-
кому извращенному виду,при этом оставив её
работоспособной,необходимы внешние средст-
ва, например,  монитор-отладчик STS5.1 или
подобные. Однако мы пока ведём разговор об
адаптации программ на диск,а не о приведе-
нии их в состояние алкогольного опъянения,
поэтому задачи у нас стоят обратные.
   Можно было бы заняться пространным опи-
санием представления чисел в двоичной фор-
ме, но я предпочту дать практические сове-
ты по вычислению того, что скрыто под мас-
кой символьной формы.
   Наиболее простым и эффективным способом
определения  истинных  значений чисел,  по
моему опыту, является подстановка операто-
ра  PRINT  вместо операторов программы.  В
этом случае все числа,  используемые прог-
раммой, будут последовательно  выведены на
экран в нормальном виде.
   Если  приведенную в начале  главы прог-
рамму изменить следующим образом (обратите
внимание, что не использующие чисел опера-
торы  и  другие  "лишние" символы заменены
пробелами, обозначенными  в  данном случае
знаком подчёркивания):

  10 PRINT 100
  20 PRINT 27:PRINT 8E-12:PRINT 65536:___
  30 PRINT _-10000,22E22;________________
  40 PRINT ___0,0
  50 PRINT _0

- то в результате её выполнения на экране
появится:

  24999
  0
  4
  0
  10      10
  25000   40000
  25000

  0 OK, 50:1

  Подставив полученные значения в програм-
му, получим привычный и понятный текст:

  10 CLEAR 24999
  20 PAPER 0: INK 4: BORDER 0: CLS
  30 PRINT AT 10,10;"PLEASE WAIT"
  40 LOAD ""CODE 25000,40000
  50 RANDOMIZE USR 25000

   Если Вы уже  потянулись к клавише Edit,
чтобы   побыстрее   расставить   операторы
PRINT,  советую Вам прочесть всё с начала.
Как уже говорилось, при вызове на редакти-
рование двоичная  форма числа безвозвратно
теряется,  остаётся  только символьная,  и
если Вы исправите INK 8E-12 на PRINT 8E-12
с помощью бейсик-редактора,  то и получите
не что иное, как 8E-12.Чтобы заменить опе-
раторы программы на PRINT,не "сломав" дво-
ичной  формы чисел,  нужны другие способы.
Можно воспользоваться  всё тем же отладчи-
ком STS5.1; в крайнем случае сойдёт и опе-
ратор POKE. В этом тексте я не ставлю сво-
ей целью обучать  работе с отладчиком, по-
этому  расскажу лучше,  как победить прог-
рамму без подручных средств.
   Оператор  POKE  очень хорош,  но только
тогда, когда знаешь, какие параметры долж-
ны следовать после него. А для этого нужно
заглянуть в память компьютера.  Можно, на-
пример,  воспользоваться строчкой, которая
выводит на экран адрес  и содержимое ячеек
памяти  и  символьное представление  этого
содержимого:

 FOR n=23755 TO 4E10: PRINT n,PEEK n;
 TAB 22;CHR$ (PEEK n*(PEEK n=32)): NEXT n

  Выполнив эту строку, на экране получим:

  23755  0     ?       номер строки
  23756  10    ?
  23757  11    ?       длина строки
  23758  0     ?
  23759  253   CLEAR   ключевое слово
  23760  49    1
  23761  48    0       сим.форма параметра
  23762  14    0
  23763  14    ?       префикс
  23764  0     ?
  23765  0     ?
  23766  167   COS     двоичная форма
                       параметра
  23767  97    _
  23768  0     ?
  23769  13    ?       возврат каретки
  23770  0     ?       номер строки
  23771  20    ?
  23772  38    &
  23773  0     ?
  23774  218   PAPER
  23775  50    2
  23776  55    7


  scroll?

   Теперь нужно внимательно изучить содер-
жимое экрана.
   Как  Вы  уже знаете, первые два байта ─
это  номер строки,  далее  ключевое  слово
CLEAR,  которое,  собственно, нам и нужно.
Берём листок бумаги и карандаш и записыва-
ем адрес, по которому находится CLEAR(2375
9),и продолжаем сей высокоинтеллектуальный
труд. После CLEAR следует символьная форма
числа,   затем двоичная,    далее ─ символ
"возврат каретки" (конец строки),  номер и
длина  следующей  строки и оператор PAPER.
Опять берём карандаш  и  записываем  адрес
оператора PAPER.
   Просмотрев программу до конца и записав
все  адреса,  которые необходимо заменить,
можно приступать к изменениям:

  POKE 23759,245: REM Заменяем CLEAR
  POKE 23774,245: REM Заменяем PAPER
  POKE 23884,245: REM Заменяем INK
  POKE 23997,245: REM Заменяем BORDER
  POKE 24110,32:  REM Заменяем CLS
  POKE 24117,32:  REM Заменяем AT

и т. д. Число 245 ─ это код ключевого сло-
ва PRINT, а 32 ─ код пробела.В данном при-
мере пробелами заменяются следующие опера-
торы и символы:

  CLS
  AT
  "PLEASE WAIT"
  ""CODE
  USR

   Когда будут сделаны все необходимые из-
менения,  просмотрите  листинг  программы,
дабы  убедиться в том, что исправлено всё,
что нужно. Затем программу можно запустить
и изучать полученные результаты.

   Иногда  эту  операцию  можно  несколько
упростить.   Если в двоичном представлении
чисел используются целые константы от 0 до
65535,  то определить их истинные значения
можно  непосредственно при просмотре памя-
ти.   Для этого  желательно добавить к ка-
рандашу и бумаге калькулятор.
   Найдите в памяти  символьную форму чис-
ла,  которое нужно "разоблачить";   за ней
следует префикс и двоичная форма.Если чис-
ло  целое  в  промежутке от 0 до 65535, то
после префикса два нуля, затем два числа в
интервале  от  0 до 255  и  ещё один ноль.
Если это не так, то определённо можно ска-
зать, что число либо не целое,либо выходит
за пределы указанного диапазона.    В этом
случае лучше прибегнуть к предыдущему спо-
собу.  Если число "подходит",  то умножьте
4-й после префикса байт на 256 и прибавьте
3-й.  В рассматриваемом примере, чтобы по-
лучить параметр оператора CLEAR, нужно вы-
числить:

  PRINT PEEK (23763+3)+256*PEEK (23763+4)

 или

  PRINT 167+256*97

   Полученный результат (24999) и есть то,
что от нас пытались утаить.
   Раскроем  секрет ещё одного распростра-
нённого фокуса, основанного на знании фор-
мата  чисел  бейсик-интерпретатором (хотя,
возможно, отгадку Вы уже знаете).
   Вам,  наверняка,  встречались  подобные
строки:

  10 CLEAR VAL "24999": INK VAL "7": PAPER
     BIN: BORDER BIN

  Таким образом программисты экономят опе-
ративную память.  Как ни парадоксально, но
запись  VAL "24999" занимает меньше места,
чем просто 24999.  Так как в первом случае
число 24999 залкючено в кавычки,то оно яв-
ляется символьной строкой,а не числом и не
имеет  после  себя  шести  байт  двоичного
представления.  При выполнении функции VAL
эта строка переводится в число.  Таким об-
разом экономится три байта. Что же касает-
ся  BIN,  то выигрыш  ещё  более очевиден.
Если вместо BIN подставить 0,то памяти бу-
дет занято на шесть байт больше, а резуль-
тат ─ тот же.
   Этот  способ  экономии памяти несколько
замедляет выполнение программы,но его мож-
но и нужно использовать в загрузчиках, так
как именно они, как правило, наиболее кри-
тичны к размеру  и  не критичны к скорости
выполнения.

       ────────────────────────────
           Продолжение будет...
      ------------------------------

  В следующем номере Micro ищите главу 4

     = ЗАГРУЗЧИКИ В МАШИННЫХ КОДАХ =

          Для тех, кто не знает,
         что такое машинный код.

        ..........................

     Gloom Demons Inc. & Computer Eye
           special for Micro 9.

                                08.10.98




Другие статьи номера:

Чемпионат - 1-й Запорожский Чемпионат по Вирусам.

Tape и Disk - Адаптация программ к системе TR-DOS (часть 3).

Chaos - описание игры "Хаос - битва волшебников".

Полезные сведения - описание врагов из игры BARD'S TALE.

Pokes - Poke's к играм.

Анекдоты - парад анекдотов.


Темы: Игры, Программное обеспечение, Пресса, Аппаратное обеспечение, Сеть, Демосцена, Люди, Программирование

Похожие статьи:
Разборка - тактика игры в игре UFO-1.
Письма читателей - За все то время , которое ушло на создание газеты , никто так и не соизволил нам написать.
UFO - НЛО: Вопросы и ответы (часть 3).
Новости - M.O.T сделал нашему музыканту Wolfу компьютер.
ZXNet - Ответы Alex'a на вопросы, задаваемые в переписке по сети Internet.

В этот день...   21 ноября