Deja Vu #04
31 марта 1998

CODING - THE оптимизация.

<b>CODING</b> - THE оптимизация.
SoundTrack: BY 5EC70R/SERIOUS S.G.4 DEJAVU
__________________________________________


(C) M.M.A/SPEED CO. aka UnBELIEVER/XTM
__________________________________________


             THE ОПТИМИЗАЦИЯ


   В первых строках этой небольшой  статьи
я хотел бы отметить тот факт,что не считаю
                себя  крутым coder'ом. Да,
└S            когда-то были и у меня по-
c└S            зывы к овладению  програм-
╞└S            мированием   и  достижению
)┴S            высот SATISFACTION  и  IN-
М┴S            SULT - хитов  тех  далеких
я┴S            времен.  Однако  тотальная
R┬S            нехватка   усидчивости   и
╡┬S            свободного времени  вскоре
                привели к осознанию  факта
невозможности  стать  настоящим,  реальным
кодером. С тех пор, закрепив за собой ста-
тус человека знающего asm Z80,я стал зани-
маться более приближенными вещами на благо
любимого   SPECCY.  Конечно,  переодически
приходиться  грузить  ALASM  для написания
loader'ов,  простых процедурок для конвер-
сии/обработки графики и звука с pC, но это
совсем  не  то,  что я вкладываю в понятие
coder.  Вот почему, в нашей ENLIGHT'овской
работе  -  NOUMENON  - нет ни одного моего
бита в коде.

   Тем не менее, вышеперечисленные причины
не мешают мне пристально следить за совре-
менным состоянием дел в coding'е  и  прог-
раммировании. Именно по этому,найдя в при-
ложении к седьмому номеру ZX-FORMAT  новый
ассемблер  STORM, я  не  смог удержаться и
попробовал сей продукт в работе.

   Про STORM можно сказать очень много хо-
роших слов. Это абсолютно злая и  свирепая
среда. На мой субъективный взгляд, _насто-
ящие_  эффекты  не могут писаться в убогих
GENS/ZEUS/MASM  и  прочих. Хороший  эффект
требует  комфортного  написания, а STORM с
фреймовым  скроллингом  по  тексту  и есть
комфортная среда. Однако каждому свое...

   Так вот, сижу я в этом STORM'е и думаю,
чего  бы такого накодить. Наблюдая за быс-
трым скроллингом  экрана, я решил попробо-
вать  написать  что-то  подобное. Учитывая
приведенные  в  первом абзаце факты, ни на
что  большее, чем  скроллинг  всего экрана
вверх  с  очисткой  нижней  линии, меня не
хватило.  Написав  первый вариант, который
наконец, нормально заработал, я почувство-
вал  безумное  желание прооптимизировать и
ускорить  свою  программу.  Именно этому и
посвящены ниже написанные байты текста.

   Итак, наша с вами задача заключается  в
том, чтобы  написать процедуру, сдвигающую
весь  экран вверх на одну пиксельную стро-
ку. Далее, эту процедуру необходимо макси-
мально ускорить. Вот такие дела!

   Т.к. вы, мои дорогие читатели, наверня-
ка  не RST#7, EXPLODER  или  FUX, не будем
особо  круто ставить вопрос о сдвиге всего
экрана, например, за  время одного фрейма.
Нас вполне устроит два-три фрейма на сдвиг
то есть около 140-210 тысяч тактов. Именно
по  этому,  предлагаю  для самого процесса
копирования  одной  линии  не использовать
стековые конструкции POP all:LD SP,nn:PUSH
all,  трудно  понимаемые начинающими.  Да-
вайте ограничимся простыми и понятными ко-
мандами  копирования  блоков - LDIR, LDDR,
LDI, LDD.

   Для того,чтобы начать оптимизацию,нужно
набросать  первый вариант процедуры, к ко-
торому предъявляется всего два  требования
-  процедура  должна  правильно работать и
быть понятной. Чтобы не изобретать велоси-
пед,  ниже  я  привожу подобную процедуру,
которая  взята  из предыдущего номера DEJA
VU.  Моя  заслуга  здесь лишь в вызывающей
программе.

;-----------------------------------------
;   SIMPLE LDIR SCROLL CODED BY M.M.A
;     USING SUBROUTEN BY Serzh Soft
;-----------------------------------------


        ORG #8000


        LD HL,#C000,DE,#4000,BC,6144
        LDIR ;    Переброска на экран
;             загруженной с адреса #C000
;                    картинки

;-----------------------------------------
;   192 раза вызываем процедуру сдвига
;     экрана вверх на одну строчку
;-----------------------------------------


        LD B,192
LOO     PUSH BC
        DI
        CALL PSRL_UP
        EI:HALT  ;можно убрать для получе-
                 ;ния равномерного "подер-
                 ;гивания" строк.

        POP BC
        DJNZ LOO
        EI
        RET
;-----------------------------------------
; Сдвиг вверх на один пиксел (38<=91)
;-----------------------------------------


PSRL_UP
        LD DE,#4000;      10


;--
LP_PSU1 LD H,D;            4
        LD L,E;            4
        LD BC,#0020;      10
        INC H;             4
        LD A,H;            4
        AND #07;           7
        JR NZ,GO_PSUP;    10
        LD A,L;            4
        ADD A,C;           4
        LD L,A;            4
        JR C,GO_PSUP;      7
        LD A,H;            4
        SUB #08;           7
        LD H,A;            4
GO_PSUP PUSH HL;          11
        LDIR ;         21/16 всего=667
        POP DE;           10
        LD A,H;            4
        CP #58;            7
        JR C,LP_PSU1;      7 цикл=149553
;--

        XOR A;             4
LP_PSU2 LD (DE),A;         7
        INC E;             4
        JR NZ,LP_PSU2;    10 цикл=672

        RET ;всего около 151 тыс.тактов

   Все комментарии по работе  этого  блока
кода вы можете найти в DEJA VU#3/40 ЛУЧШИХ
ПРОЦЕДУР (ЛИСТИНГ 2). В  приведенном  выше
листинге вместо комментариев стоят  значе-
ния времени выполнения команд в тактах.

   Набрав и отассемблировав процедуру,  вы
должны загрузить с адреса #C000(49152) ка-
кую-либо графику, чтобы было что сдвигать.
Я рекомендую картинку aso scr.<C>, которую
можно  найти  на диске с DEJA VU#2. Дело в
том,  что эта картинка черно-белая и зани-
мает  весь  экран.  Это  позволит детально
пронаблюдать при скроллинге те места экра-
на, где луч развертки обгоняет нашу проце-
дуру обновляющую экран. А луч нас  обгонит
непременно, так как вся процедура занимает
около  151 тыс.тактов (более точно сказать
затруднительно,потому что нужно долго счи-
тать).  При подсчете тактов, я брал только
время  выполнения  процедуры  PSRL_UP  без
учета команды RET и вызывающей программы.

   Вот и пришло время  начать оптимизацию.
"Как?", спросите вы меня. Наивные люди, вы
полагали,  что я буду все объяснять доско-
нально и до последнего байта. Нет! Всю эту
грязную  работу  по  оптимизации предстоит
проделать  вам  и  только  вам. Кто из нас
двоих учиться ассемблеру, я или вы?

   Некоторые намеки придется все же  дать.
Конечно, следует  заменить  LDIR  на более
быстрый  LDI,  стек бля переброски графики
мы  договорились не  использовать! Однако,
стек  можно использовать для других целей,
там, где  метко  поставленный PUSH или POP
заменит  целую  прорву  команд. Непременно
нужно  ускорить  процесс перехода от одной
экранной строки к другой и,конечно же,сле-
дует.... Нет! Вы сами должны догадаться...
Хотя,  использовав  даже  половину из моих
подсказок,  вы сможете с легкостью достиг-
нуть отметки в 116  тыс.тактов, для  даль-
нейшего улучшения неплохо немного пораски-
нуть мозгами.

   Ну,а чтобы дать хоть какой-либо стимул, я
приведу  данные  по той процедуре, которую
удалось  написать  мне, придерживаясь ldir
ограничения на переброску строки:

Размер процедуры - 188 байт
(после первого запуска возростает до 572)


Примерное время  выполнения - 111 тыс.так-
тов  ( почти  точное  время  выполнения  -
110.682 )


   Для жаждущих взглянуть на этого  монст-
ра,в приложении к журналу помещен исходник
(файл называется LDISCROL.<C>). Я попросил
специально оставить его в формате STORM'а,
так  как  этот ассемблер есть не у всех, и
по  сему, вы скорее всего не сможете сразу
посмотреть в ответ. Придется немного поду-
мать тем местом, которое у некоторых назы-
вается головой.

   Конечно, я подозреваю и  сознаю, что  и
мою процедуру можно ускорить. Если же  во-
обще не двигать картинку на экране,а брать ее
из  памяти и выводить в нужном месте (даже
с  помощью LDIR'ов) , то...... Однако, это
совсем другая история!

    Powered by LACRIMOSA'95 "INFERNO"
      MOTHER RUSSIA/SAMARA/13.02.97

P.S. "Пятница 13-oe....."



Другие статьи номера:

Аперативчик - Об управлении в обoлочке DEJA VU и о содержании 4 номера журнала

Тема - Бессмертный SPECCY - "проект будущего Speccy".

Капля припоя - Эмулятор ZX-SPECTRUM v3.04 - Руководство пользователя.

Капля припоя - Эмулятор ZX-SPECTRUM v0.20b by LION.

Капля припоя - ZX-SPECTRUM NAVIGATOR v1.00beta.

SOFTWARE - Презентация игры "Властелин Ориона".

SOFTWARE - Трактат о великой пользительности некоторых авторский разработок.

SOFTWARE - Обзор новых игр: FISHER pre-reliz , EMPIRE demo , LITTLE GHOST demo, СТАЛКЕР, ELOPEMENT, WORDLIFE.

SOFTWARE - Обзор новинок демосцены: HALLUCINATIONS in OPERA, INFARCT, YER ACHE 2, AMIGA, RAY EURODEMO, ZEST.

CODING - Ремикс некоторых процедур 93 года: SCREEN APARAT, Теневой контур, LOOK BASIC PROGRAMM-2.

CODING - Печать чисел в разных системах счисления: печать десятичных и шестнадцатеричных, двоичных и римских чисел, печать чисел в системе счисления с основанием, установленным пользователем.

CODING - процедура "Плазменные шарики".

CODING - Плавное затухание музыки в любой момент времени.

CODING - THE оптимизация.

CODING - Вращение спрайтов.

ANOTHER WORLD - О компьютере Be Box.

ANOTHER WORLD - Аргументы и факты (AMIGA vs PC).

Доска почета - Официальная информация о фестивале FunTop-98.

Доска почета - Конкурс на самую лучшую минидемку (1024 байта).

Семь и 1/2 - Урок Ламера или сто и одна процедура очистки аккумулятора.

Семь и 1/2 - День дурака (приколы и юмор).

Проба пера - Последняя гастроль или VIRTUL-но AMIG-ный синдром.

Проба пера - Поэма о добре и зле.

Проба пера - Возвращение Клэр.

Проба пера - Стихи: Спящий студент, Басня о Матане, Медкомиссия.

Проба пера - Рассказ "Война продолжается" (продолжение, глава 6).

Реклама - Реклама и объявления ...


Темы: Игры, Программное обеспечение, Пресса, Аппаратное обеспечение, Сеть, Демосцена, Люди, Программирование

Похожие статьи:
Отдохнем - глава корпорации "Микрософт" Билл Гейтс посетил Россию, где лечился от импотенций.
Юмор - Анекдоты.
Меломания - VOODOO (рус.)Перевод альбома King Diamond-98.
От авторов - Второй "специальный" номер...
User Group - Текстовые редакторы.

В этот день...   18 апреля