Свежие комментарии

Title Comment
Никаких исходников, всё

Никаких исходников, всё предельно просто. Просто моё понимание/опыт на данный момент как выжать максимум из дисков. Почта нужна что бы послать один файл (если захочешь попробовать).

Гайки без комментариев смысла

Гайки без комментариев смысла не имеют.

Гайкам с комментариями буду очень рад, потому что читать исходники я вот точно не буду, а документации на новомодные гайки практически нету (Evil tuning guide, но оно не безумно новое)

Действительно веселее :-).

Действительно веселее :-). Значит распределение контрольных блоков зависит от разных причин. Для raidz2 больший recordsize явно предпочтительней. Я бы ещё потестировал 512kB на 6 дисковой конфигурации, это избавит стек ввода-вывода от дополнительной разборки/cборки запросов (все запросы к данным =MAXPHYS), хотя выгода наверно мизерная, но зато немного снизится латентность.
В 7 дисковом raidz2 ты явно получишь плюс полную скорость добавленного диска как по чтению, так и по записи (наверно даже ещё больше). А из минусов - получается только небольшие (~1%) дополнительные потери по занимаемому объёму. Плюсов намного больше :-).
Если всё равно будешь двигать данные, то могу на почту выслать все мои "гайки". Может что-то подскажет, а может понравится :-). Только адрес сбросишь.

Сделал датасет с recordsize

Сделал датасет с recordsize=128k. Там оно выглядит не столь позорно:

device     r/s   w/s     kr/s     kw/s  ms/r  ms/w  ms/o  ms/t qlen  %b
ada1      1733     0 126703.6      0.0     0     0     0     0    0  57
ada2      1611     0 124128.9      0.0     1     0     0     1    0  59
ada3       984     0  83488.9      0.0     1     0     0     1    2  50
ada4      1260     0 126317.5      0.0     1     0     0     1    3  70
ada5       858     0  83709.9      0.0     1     0     0     1    0  57
ada6      1082     0 123662.8      0.0     2     0     0     2    3  79

Хотя общий результат по скорости чтения примерно тот же (но с учетом того, что это на живом сервере и там в фоне какая-то нагрузка, в устойчивовти этих данных есть сомнения и надо будет на пустом датасете тренироваться).

При этом, 7-й диск добавляет изрядно: http://blog.lexa.ru/2016/12/06/freebsd_zfs_read_speed_oni_ubili_kenni.html

И я его таки буду ставить, потому что данные все едино двигать придется.

Дык, по другому и не делают...

...тестовый стенд называется!
-
А почему Гугл вовсю юзал именно RAID 10? (не знаю, как сейчас)
А почему машина с ZFS "никогда не спит"?

Кстати, у Вас реальной инфы - море! --> создайте 96GB файл = архив реальных данных
его и гоняйте туда-сюда.
...и на "НИЗКО"_отформатированных дисках. А то мало ли..! ...вдруг старую ФС читают! ...

Опять же, если "однопоточное чтение" = 4 файла по ~100МБ, то и тестовая нагрузка должна соответствовать этому; а не 1005000 Гиговый файл гонять. Нет?

Тогда вполне нормально.

Тогда вполне нормально.

raidz1 - recordsize и ashift

raidz1 - recordsize и ashift такие же (1m/12)

Там не 200. Там 185/120

Там не 200. Там 185/120 (начало, хвост) у быстрых и 162/113 у более медленных.

Это dd if=/dev/ada.. of=/dev/null bs=1m skip=0m/5m

Пул заполнен на 44%, куда лег тестовый файл - хрен пойми (ну то есть zdb пойми, но я не буду в его выдаче разбираться)

Или может быть на системе

Или может быть на системе (где raidz1) минимальный размер записымаемого блока меньше, даже не знаю.

Там в комментарии к

Там в комментарии к исходникам, вроде было что-то - про только для ординарной чётности.

Ты хочешь сказать, что сейчас

Ты хочешь сказать, что сейчас raidz2 на 6 дисках превратился в полный аналог raid4 с двумя дисками чётности? Хотя, если сейчас никто не дробит блоки и все записываемые блоки идеально деляться на 4 и минимальный размер записываемого блока 4х4=16kB, то всё наверно может быть :-). Но как по мне, если это так, то это тоже не нормально. Ещё вопрос, если это диски со скоростью 200MB/s, то кто съел 50MB/s? Хотя может быть это пролёт над метаданными или чтение ближе к концу дисков. Если гипотеза о raid4 подтвердится, то получается, что на многопоточной нагрузке 7 дисков в raidz2 явно будут смотреться лучше (там всё должно размазаться, но проверить желательно). Да, чем больше я "приобщаюсь" к raidz2 тем больше вопросов возникает. Получается эффективность при последовательном чтении чуть больше 50% (610/1180).

Да, при этом 5-дисковый

Да, при этом 5-дисковый raidz1 ведет себя нормально, там чтение по всем 5 дискам размазано.
То есть похоже вот этот самый "сдвиг контрольной суммы через мегабайт" попадает всегда в одну дырочку.

Ну вот "раньше" ("плохие

Ну вот "раньше" ("плохие файлы") загрузка постепенно вращалась между дисками. То есть ada1/ada6 (в данном примере) не были всегда нулевыми.

Сейчас же - там строго нули. Меня это раздражает и так как все едино данные опять двигать, я думаю туда 7-й диск докупить, благо на новой материнке 8 портов, а не 6.

Похоже раньше кто-то дробил

Похоже раньше кто-то дробил блоки. Мысли есть, но я думаю там быстро разберутся.
Статистика красивая. Вроде бы подтверждается гипотеза, что на 6 дисках raidz2 это много сдвинутых условно raid4, но похоже уменьшить величину столбика до нужного размера не удастся и как следствие загрузить все 6 дисков.

Ну вот чтение "хорошего"

Ну вот чтение "хорошего" файла выглядит так (это 5сек-усреднение):

device     r/s   w/s     kr/s     kw/s  ms/r  ms/w  ms/o  ms/t qlen  %b
ada1         0     0      0.0      0.0     0     0     0     0    0   0
ada2      1175     0 150479.7      0.0     1     0     0     1    0  43
ada3      1175     0 150479.7      0.0     0     0     0     0    0  40
ada4      1200     0 153600.3      0.0     2     0     0     2    0  57
ada5      1153     0 147705.9      0.0     3     0     0     3    6  81
ada6         0     0      0.0      0.0     0     0     0     0    0   0

два диска простаивают, на 4-х запросы 128kb

Плохой файл не сохранился.

Впрочем, я понял как ты

Впрочем, я понял как ты считаешь.
"чуть более 30%" это и есть в полтора раза.

Просто понятие скорости (то есть "количества работы за единицу времени") - оно сложное.

Чтобы два раза не вставать, "90%" в твоем способе подсчета - это в 10 раз (быстрее).

avx2 же еще.

avx2 же еще.

На одинаковой частоте (и если не упирается в память) - в два раза (относительно, соответственно, sse4).

Ну а 1.5 раза - вот они на картинке выше.

Ну вот data move дойдет до -

Ну вот data move дойдет до - и тогда.

Не интересно там, где было

Не интересно там, где было raidz2 из 6 и ~32kB. Если будет оказия - черкани.

Гоню. ~128 - это на запись.

Гоню. ~128 - это на запись (5 дисков в raidz1, ashift=12)
На чтение вижу 170 (5 дисков в raidz2, ashift=12)

Ну вот сейчас в бою (tar cvf;

Ну вот сейчас в бою (tar cvf; tar xvf) - в районе 120-128к

Я насчитал чуть более 30%

Я насчитал чуть более 30% (точнее около 32%).
253 -- 100%
169 -- x

Недавно сравнивал i7 второго и шестого поколения одинаковой частоты, вышло так же.
4-ое поколение на ~18% быстрее, 6-ое еще на 15%.
Но, i7 второго поколения есть 4х ядерные и получается, что они быстрее 2х ядерных шестого поколения.
И если энергопотребление устраивает, смысла апгрейдить нет.

Так что нет там 1.5 раза.

Может заметил - какой средний

Может заметил - какой средний размер запроса был при чтении "быстрого" файла?

Мне чтобы проводить

Мне чтобы проводить эксперименты на пустом пуле - надо разобрать ящик, сунуть туда другой контроллер и другие диски и пока оно так работает - ящик невозможно использовать (а вообще у меня там активный а не архивный сторадж).

То есть вот если там есть лаба с 12-ю дисками у кого-то, то вот им и карты в руки.

Как отрепортят что починили - ну да, один раз проверю.

Ну ничего в голову не

Ну ничего в голову не приходит другого.

zdb наверное умеет такое показать, но я не умею его читать.

Интересная развязка :-).

Интересная развязка :-). Получается аллокатор выделял место под записываемые блоки на дисках не последовательно?

freebsd-fs

Ну, вот, пошла движуши, вот и Стив подтянулся, так что я своё ставлю on hold (но если что -- готов какие-нибудь эксперименты попроводить, если ты short of resources)

Похоже что стандартный.

Похоже что стандартный. Значит и чувствительности вполне железные. Только с исо 100 не совсем понятно, то, что передержка, это понятно, но по остальным параметрам нет, и размер файлов отличается почти на полтора мегабайта в плюс у исо 100

Ну надо смотреть на камеру.

Ну надо смотреть на камеру. Но -0.7 - это не стандартный ли сдвиг точки серого (а -1.7 - соответственно, нестандартный)?

testbed is weak

то что есть под рукой довольно слабенькое, главное, памяти всего 4G, но, надеюсь, на тесты сгодится.

попросил коллег ткнуть дисочков, пошол строить.

Pages

Subscribe to comments_recent_new