Size: a a a

OpenNebula - русскоговорящее сообщество

2020 April 01

k

kvaps in OpenNebula - русскоговорящее сообщество
Nick Potemkin
и все-таки проблемы drbd (например падение удаленного хоста с мастер-репликой) доходят до виртуалок
как-то можно сделать, чтобы этого не происходило? может таймауты поменьше какие выставить?

происходит вот примерно что - после этого машинка впадает в коматозное состояние, сеть почти потеряна, и вообще поможет ей только ребут

Apr  1 15:49:06 APP04 kernel: NMI watchdog: BUG: soft lockup - CPU#8 stuck for 25s! [java:13965]
Apr  1 15:49:06 APP04 kernel: Modules linked in: ipt_REJECT nf_reject_ipv4 iptable_filter binfmt_misc nls_utf8 isofs ppdev sb_edac iosf_mbi kvm_intel kvm i
rqbypass crc32_pclmul ghash_clmulni_intel cirrus ttm aesni_intel lrw gf128mul glue_helper ablk_helper drm_kms_helper cryptd syscopyarea sysfillrect parport_pc sysimgbl
t fb_sys_fops parport drm sg joydev virtio_balloon i2c_piix4 drm_panel_orientation_quirks pcspkr ip_tables xfs libcrc32c sr_mod cdrom sd_mod crc_t10dif crct10dif_gener
ic ata_generic pata_acpi virtio_net virtio_scsi floppy serio_raw ata_piix libata crct10dif_pclmul crct10dif_common crc32c_intel virtio_pci virtio_ring virtio sunrpc
Apr  1 15:49:06 APP04 kernel: CPU: 8 PID: 13965 Comm: java Kdump: loaded Not tainted 3.10.0-957.12.1.el7.x86_64 #1
Apr  1 15:49:06 APP04 kernel: Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS 1.10.2-1ubuntu1 04/01/2014
Apr  1 15:49:06 APP04 kernel: task: ffff949475201040 ti: ffff94991ced4000 task.ti: ffff94991ced4000
Apr  1 15:49:06 APP04 kernel: RIP: 0010:[<ffffffffa59842a7>]  [<ffffffffa59842a7>] clear_page_c_e+0x7/0x10
Apr  1 15:49:06 APP04 kernel: RSP: 0000:ffff94991ced7b08  EFLAGS: 00010246
Apr  1 15:49:06 APP04 kernel: RAX: 0000000000000000 RBX: ffffccd391cd07c0 RCX: 0000000000001000
Apr  1 15:49:06 APP04 kernel: RDX: ffffffffa6081f62 RSI: 0000000000000000 RDI: ffff9498b3400000
Apr  1 15:49:06 APP04 kernel: RBP: ffff94991ced7c18 R08: ffffffffa6081f51 R09: ffffccd391cd0040
Apr  1 15:49:06 APP04 kernel: R10: ffff949affb856c0 R11: 00003ffffffff000 R12: ffffccd382d57540
Apr  1 15:49:06 APP04 kernel: R13: ffffccd382d57500 R14: ffff94991ced4000 R15: ffffccd382d57500
Apr  1 15:49:06 APP04 kernel: FS:  00007f20b0f1a700(0000) GS:ffff949ae5400000(0000) knlGS:0000000000000000
Apr  1 15:49:06 APP04 kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Apr  1 15:49:06 APP04 kernel: CR2: 00000003fa944000 CR3: 0000000691278000 CR4: 00000000001607e0
Apr  1 15:49:06 APP04 kernel: Call Trace:
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c07f2>] ? get_page_from_freelist+0x412/0xa70
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c0fc6>] __alloc_pages_nodemask+0x176/0x420
Apr  1 15:49:06 APP04 kernel: [<ffffffffa58115d5>] alloc_pages_vma+0xb5/0x200
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57e9b17>] handle_pte_fault+0x887/0xd10
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57ec0bd>] handle_mm_fault+0x39d/0x9b0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d705e3>] __do_page_fault+0x203/0x4f0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d709b6>] trace_do_page_fault+0x56/0x150
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6ff42>] do_async_page_fault+0x22/0xf0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6c788>] async_page_fault+0x28/0x30
Apr  1 15:49:06 APP04 kernel: Code: bc 0f 1f 00 e8 5b 31 d1 ff 90 90 90 90 90 90 90 90 90 90 90 b9 00 02 00 00 31 c0 f3 48 ab c3 0f 1f 44 00 00 b9 00 10 00
00 31 c0 <f3> aa c3 66 0f 1f 44 00 00 eb ee 0f 1f 84 00 00 00 00 00 0f 1f
А это лог с виртуалки получается?
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
нет, он четко по времени связан с падением удаленной ноды drbd
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
kvaps
А это лог с виртуалки получается?
да, конечно
источник

FD

Find DT in OpenNebula - русскоговорящее сообщество
Nick Potemkin
да, конечно
А что в виртуалке делают generic ядра?
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
4.15.0-91-generic #92-Ubuntu - это гипервизор
в виртуалке centos 7 (требования такие)
источник

G

Glor in OpenNebula - русскоговорящее сообщество
Find DT
А что в виртуалке делают generic ядра?
А что тогда пихать в виртуалку? Лоулатенси?
источник
2020 April 02

k

kvaps in OpenNebula - русскоговорящее сообщество
источник
2020 April 03

a

amindomao in OpenNebula - русскоговорящее сообщество
привет

а ни у кого часом не возникало задачи с'mapp'ить существующий в CEPH'е образ в image opennebula'ы?
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
amindomao
привет

а ни у кого часом не возникало задачи с'mapp'ить существующий в CEPH'е образ в image opennebula'ы?
Вроде ничего сложного:
Создаёшь имадж в опеннебуле, потом удаляешь в цефе и переименовываешь старый имадж на новое имя
источник

a

amindomao in OpenNebula - русскоговорящее сообщество
отличная мысль, спасибо
не подумал сразу пойти таким путем
источник

@

@i.am.not.root__ in OpenNebula - русскоговорящее сообщество
А новость опубликована 1 апреля, совпадение? 😊
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
@i.am.not.root__
А новость опубликована 1 апреля, совпадение? 😊
не думаю)
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
источник

@

@i.am.not.root__ in OpenNebula - русскоговорящее сообщество
значит, подождем , увидим
источник

@

@i.am.not.root__ in OpenNebula - русскоговорящее сообщество
кстати ни кто еще не двигался до 5.10.3 ?
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
@i.am.not.root__
кстати ни кто еще не двигался до 5.10.3 ?
Я на 5.10.3 сейчас
источник

@

@i.am.not.root__ in OpenNebula - русскоговорящее сообщество
а у тебя  OVS используется или мосты линукса обычные?
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
@i.am.not.root__
а у тебя  OVS используется или мосты линукса обычные?
linux bridge, vlan, vxlan
источник

@

@i.am.not.root__ in OpenNebula - русскоговорящее сообщество
в release note нашел
Deprecate brctl: The ip-route2 toolset replaces brctl to manage bridges for the KVM/LXD networking
нормально все проходит при обновлении? проблем не наблюдал?
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
@i.am.not.root__
в release note нашел
Deprecate brctl: The ip-route2 toolset replaces brctl to manage bridges for the KVM/LXD networking
нормально все проходит при обновлении? проблем не наблюдал?
Да у нас всё впоряде в проде уже давно
источник