Size: a a a

OpenNebula - русскоговорящее сообщество

2020 March 27

T

Timur in OpenNebula - русскоговорящее сообщество
Кирилл Бобров
Всем привет! быстрый вопрос, я же могу щас шлепнуть снапшот с виртуталки, а потом из нее темпелейт зафигачить и развернуть его на на другом датосторе без потери данных ?
Я сделал снапшот, потом из него ресурс и примаунтил к другой виртуалке. Причём это все из небулы. Руками через linstor-cli не прокатило
источник
2020 March 31

CA

Clark Antollare in OpenNebula - русскоговорящее сообщество
Народ, добрых удаленных дней. Не подскажите, существует ли имплементация 10gb/s драйвера для виртуальных машин Opennebula. SR-IOV насколько я понял как фичу не завезли, только PCI passthrough доступен?
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Clark Antollare
Народ, добрых удаленных дней. Не подскажите, существует ли имплементация 10gb/s драйвера для виртуальных машин Opennebula. SR-IOV насколько я понял как фичу не завезли, только PCI passthrough доступен?
https://github.com/OpenNebula/addon-kvm-sr-iov вот нашлось что-то
источник

G

Glor in OpenNebula - русскоговорящее сообщество
this driver has been developed to support OpenNebula 4.x and KVM
ну такое
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
не думаю что что-то кардинально поменялось
источник

M

Max in OpenNebula - русскоговорящее сообщество
а просто virtio не?
источник

M

Max in OpenNebula - русскоговорящее сообщество
[ ID] Interval           Transfer     Bandwidth       Retr
[  4]   0.00-10.00  sec  9.36 GBytes  8.04 Gbits/sec  5286             sender
[  4]   0.00-10.00  sec  9.35 GBytes  8.03 Gbits/sec                  receiver
iperf Done.
источник

M

Max in OpenNebula - русскоговорящее сообщество
это при 2х10G на гипервизорах с virtio
источник

AS

Alexey Shabalin in OpenNebula - русскоговорящее сообщество
При bonding 2x10G в один поток вы максимум получите 10G.
20G можно получить только в несколько сессий.
источник
2020 April 01

M

Max in OpenNebula - русскоговорящее сообщество
это я в крусе, спасибо
источник

M

Max in OpenNebula - русскоговорящее сообщество
я к тому что зачем искать 10G драйвер если есть virtio
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
и все-таки проблемы drbd (например падение удаленного хоста с мастер-репликой) доходят до виртуалок
как-то можно сделать, чтобы этого не происходило? может таймауты поменьше какие выставить?

происходит вот примерно что - после этого машинка впадает в коматозное состояние, сеть почти потеряна, и вообще поможет ей только ребут

Apr  1 15:49:06 APP04 kernel: NMI watchdog: BUG: soft lockup - CPU#8 stuck for 25s! [java:13965]
Apr  1 15:49:06 APP04 kernel: Modules linked in: ipt_REJECT nf_reject_ipv4 iptable_filter binfmt_misc nls_utf8 isofs ppdev sb_edac iosf_mbi kvm_intel kvm i
rqbypass crc32_pclmul ghash_clmulni_intel cirrus ttm aesni_intel lrw gf128mul glue_helper ablk_helper drm_kms_helper cryptd syscopyarea sysfillrect parport_pc sysimgbl
t fb_sys_fops parport drm sg joydev virtio_balloon i2c_piix4 drm_panel_orientation_quirks pcspkr ip_tables xfs libcrc32c sr_mod cdrom sd_mod crc_t10dif crct10dif_gener
ic ata_generic pata_acpi virtio_net virtio_scsi floppy serio_raw ata_piix libata crct10dif_pclmul crct10dif_common crc32c_intel virtio_pci virtio_ring virtio sunrpc
Apr  1 15:49:06 APP04 kernel: CPU: 8 PID: 13965 Comm: java Kdump: loaded Not tainted 3.10.0-957.12.1.el7.x86_64 #1
Apr  1 15:49:06 APP04 kernel: Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS 1.10.2-1ubuntu1 04/01/2014
Apr  1 15:49:06 APP04 kernel: task: ffff949475201040 ti: ffff94991ced4000 task.ti: ffff94991ced4000
Apr  1 15:49:06 APP04 kernel: RIP: 0010:[<ffffffffa59842a7>]  [<ffffffffa59842a7>] clear_page_c_e+0x7/0x10
Apr  1 15:49:06 APP04 kernel: RSP: 0000:ffff94991ced7b08  EFLAGS: 00010246
Apr  1 15:49:06 APP04 kernel: RAX: 0000000000000000 RBX: ffffccd391cd07c0 RCX: 0000000000001000
Apr  1 15:49:06 APP04 kernel: RDX: ffffffffa6081f62 RSI: 0000000000000000 RDI: ffff9498b3400000
Apr  1 15:49:06 APP04 kernel: RBP: ffff94991ced7c18 R08: ffffffffa6081f51 R09: ffffccd391cd0040
Apr  1 15:49:06 APP04 kernel: R10: ffff949affb856c0 R11: 00003ffffffff000 R12: ffffccd382d57540
Apr  1 15:49:06 APP04 kernel: R13: ffffccd382d57500 R14: ffff94991ced4000 R15: ffffccd382d57500
Apr  1 15:49:06 APP04 kernel: FS:  00007f20b0f1a700(0000) GS:ffff949ae5400000(0000) knlGS:0000000000000000
Apr  1 15:49:06 APP04 kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Apr  1 15:49:06 APP04 kernel: CR2: 00000003fa944000 CR3: 0000000691278000 CR4: 00000000001607e0
Apr  1 15:49:06 APP04 kernel: Call Trace:
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c07f2>] ? get_page_from_freelist+0x412/0xa70
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c0fc6>] __alloc_pages_nodemask+0x176/0x420
Apr  1 15:49:06 APP04 kernel: [<ffffffffa58115d5>] alloc_pages_vma+0xb5/0x200
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57e9b17>] handle_pte_fault+0x887/0xd10
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57ec0bd>] handle_mm_fault+0x39d/0x9b0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d705e3>] __do_page_fault+0x203/0x4f0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d709b6>] trace_do_page_fault+0x56/0x150
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6ff42>] do_async_page_fault+0x22/0xf0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6c788>] async_page_fault+0x28/0x30
Apr  1 15:49:06 APP04 kernel: Code: bc 0f 1f 00 e8 5b 31 d1 ff 90 90 90 90 90 90 90 90 90 90 90 b9 00 02 00 00 31 c0 f3 48 ab c3 0f 1f 44 00 00 b9 00 10 00
00 31 c0 <f3> aa c3 66 0f 1f 44 00 00 eb ee 0f 1f 84 00 00 00 00 00 0f 1f
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Nick Potemkin
и все-таки проблемы drbd (например падение удаленного хоста с мастер-репликой) доходят до виртуалок
как-то можно сделать, чтобы этого не происходило? может таймауты поменьше какие выставить?

происходит вот примерно что - после этого машинка впадает в коматозное состояние, сеть почти потеряна, и вообще поможет ей только ребут

Apr  1 15:49:06 APP04 kernel: NMI watchdog: BUG: soft lockup - CPU#8 stuck for 25s! [java:13965]
Apr  1 15:49:06 APP04 kernel: Modules linked in: ipt_REJECT nf_reject_ipv4 iptable_filter binfmt_misc nls_utf8 isofs ppdev sb_edac iosf_mbi kvm_intel kvm i
rqbypass crc32_pclmul ghash_clmulni_intel cirrus ttm aesni_intel lrw gf128mul glue_helper ablk_helper drm_kms_helper cryptd syscopyarea sysfillrect parport_pc sysimgbl
t fb_sys_fops parport drm sg joydev virtio_balloon i2c_piix4 drm_panel_orientation_quirks pcspkr ip_tables xfs libcrc32c sr_mod cdrom sd_mod crc_t10dif crct10dif_gener
ic ata_generic pata_acpi virtio_net virtio_scsi floppy serio_raw ata_piix libata crct10dif_pclmul crct10dif_common crc32c_intel virtio_pci virtio_ring virtio sunrpc
Apr  1 15:49:06 APP04 kernel: CPU: 8 PID: 13965 Comm: java Kdump: loaded Not tainted 3.10.0-957.12.1.el7.x86_64 #1
Apr  1 15:49:06 APP04 kernel: Hardware name: QEMU Standard PC (i440FX + PIIX, 1996), BIOS 1.10.2-1ubuntu1 04/01/2014
Apr  1 15:49:06 APP04 kernel: task: ffff949475201040 ti: ffff94991ced4000 task.ti: ffff94991ced4000
Apr  1 15:49:06 APP04 kernel: RIP: 0010:[<ffffffffa59842a7>]  [<ffffffffa59842a7>] clear_page_c_e+0x7/0x10
Apr  1 15:49:06 APP04 kernel: RSP: 0000:ffff94991ced7b08  EFLAGS: 00010246
Apr  1 15:49:06 APP04 kernel: RAX: 0000000000000000 RBX: ffffccd391cd07c0 RCX: 0000000000001000
Apr  1 15:49:06 APP04 kernel: RDX: ffffffffa6081f62 RSI: 0000000000000000 RDI: ffff9498b3400000
Apr  1 15:49:06 APP04 kernel: RBP: ffff94991ced7c18 R08: ffffffffa6081f51 R09: ffffccd391cd0040
Apr  1 15:49:06 APP04 kernel: R10: ffff949affb856c0 R11: 00003ffffffff000 R12: ffffccd382d57540
Apr  1 15:49:06 APP04 kernel: R13: ffffccd382d57500 R14: ffff94991ced4000 R15: ffffccd382d57500
Apr  1 15:49:06 APP04 kernel: FS:  00007f20b0f1a700(0000) GS:ffff949ae5400000(0000) knlGS:0000000000000000
Apr  1 15:49:06 APP04 kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Apr  1 15:49:06 APP04 kernel: CR2: 00000003fa944000 CR3: 0000000691278000 CR4: 00000000001607e0
Apr  1 15:49:06 APP04 kernel: Call Trace:
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c07f2>] ? get_page_from_freelist+0x412/0xa70
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57c0fc6>] __alloc_pages_nodemask+0x176/0x420
Apr  1 15:49:06 APP04 kernel: [<ffffffffa58115d5>] alloc_pages_vma+0xb5/0x200
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57e9b17>] handle_pte_fault+0x887/0xd10
Apr  1 15:49:06 APP04 kernel: [<ffffffffa57ec0bd>] handle_mm_fault+0x39d/0x9b0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d705e3>] __do_page_fault+0x203/0x4f0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d709b6>] trace_do_page_fault+0x56/0x150
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6ff42>] do_async_page_fault+0x22/0xf0
Apr  1 15:49:06 APP04 kernel: [<ffffffffa5d6c788>] async_page_fault+0x28/0x30
Apr  1 15:49:06 APP04 kernel: Code: bc 0f 1f 00 e8 5b 31 d1 ff 90 90 90 90 90 90 90 90 90 90 90 b9 00 02 00 00 31 c0 f3 48 ab c3 0f 1f 44 00 00 b9 00 10 00
00 31 c0 <f3> aa c3 66 0f 1f 44 00 00 eb ee 0f 1f 84 00 00 00 00 00 0f 1f
А что за ядро?
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
4.15.0-91-generic #92-Ubuntu
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
если мы про гипер
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
да, про него
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
У меня все ноды с serial-портом идут (HPE блейды)
Так вот меня был совершенно эпический баг, когда ядро начинало активно срать сообщениями в консоль serial-порт не справлялся, и пока он всё это печатал ядро терпиливо ждало...
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Не думаю что у тебя таже проблема, но вдруг
источник

k

kvaps in OpenNebula - русскоговорящее сообщество
Не мог-ли твой soft lockup быть вызван багами в сети?
источник

NP

Nick Potemkin in OpenNebula - русскоговорящее сообщество
не похоже ) на самом гипере в логе ничего нет, естественно... а у виртуалки не слишком много сообщений - это практически все
источник