MemSQL 奇怪的 Insert/Update 行为

MemSQL Weird Insert/Update Behaviour

我们正在使用单节点 MemSQL,并且一切正常,但是当我们尝试将 MemSQL 设置移动到使用多节点时,insert/update 语句表现得非常奇怪

我的 table 结构如下所示,删除了许多列,以保持简短

CREATE /*!90618 REFERENCE*/ TABLE `fact_orderitem_hourly_release_update` 
(
  `order_id` int(11) NOT NULL DEFAULT '0',
  `customer_login` varchar(128) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
  `warehouse_id` int(11) DEFAULT NULL,
  `city` varchar(100) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
  `store_id` int(11) DEFAULT NULL,
  PRIMARY KEY (`order_id`)
);

CREATE TABLE `fact_orderitem_hourly_scale` (
  `order_id` int(11) NOT NULL DEFAULT '0',
  `order_group_id` int(11) NOT NULL DEFAULT '0',
  `item_id` int(11) NOT NULL,
  `sku_id` int(11) NOT NULL DEFAULT '0',
  `sku_code` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
  `po_type` varchar(20) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
  `store_order_id` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,
  `bi_last_modified_on` timestamp NOT NULL DEFAULT '0000-00-00 00:00:00.000000',
  PRIMARY KEY (`item_id`,`sku_id`),
  /*!90618 SHARD */ KEY `sku_id` (`sku_id`),
  KEY `idx_fact_orderitem_hourly_lmd` (`bi_last_modified_on`),
  KEY `idx_fact_orderitem_hourly_ord` (`order_id`),
  KEY `idx_order_group_id` (`order_group_id`),
  KEY `idx_store_order_id` (`store_order_id`)
);

我的加载脚本:

mysql -h$LiveMemSQL_DB -u$LiveMemSQL_USER --password=$LiveMemSQL_PASS -P$LiveMemSQL_PORT --verbose reports_and_summary < /home/titan/brand_catalog/upsert_memsql_orl_update.sql

Contents of .SQL File :

--start of .sql file
    TRUNCATE TABLE reports_and_summary.fact_orderitem_hourly_release_update;

#Load data into staging

LOAD DATA LOCAL INFILE '/myntra/redshift/delta_files/live_scale_order_release_upd.txt' INTO TABLE reports_and_summary.fact_orderitem_hourly_release_update LINES TERMINATED BY '\n';


#Insert/Update statement  
INSERT INTO reports_and_summary.fact_orderitem_hourly_scale
(
item_id,
sku_id,
customer_login,
order_status,
is_realised,
is_shipped,
shipping_charge,
gift_charge,
warehouse_id,
city,
store_id
)
select
fo.item_id,
fo.sku_id,
fr.customer_login,
fr.order_status,
fr.is_realised,
fr.is_shipped,
fr.shipping_charge,
fr.gift_charge,
fr.warehouse_id,
fr.city,
fr.store_id
from fact_orderitem_hourly_release_update fr
join fact_orderitem_hourly_scale fo
on fr.order_id=fo.order_id
ON duplicate key update
customer_login=values(customer_login),
order_status=values(order_status),
is_realised=values(is_realised),
is_shipped=values(is_shipped),
shipping_charge=values(shipping_charge),
gift_charge=values(gift_charge),
warehouse_id=values(warehouse_id),
city=values(city),
store_id=values(store_id);

--结束.sql文件

当我通过 mysql 命令行客户端触发上述 .sql 时,它有时会起作用,但不会多次起作用,有时如果我执行相同的 .sql 文件连续 5-10 次,更新将在其中一次运行中生效,有时会说例如如果有 3 条记录 order_id 101 和状态 SHIPPED 并且我们在合并中得到更新 table 说订单状态已更改为 DELIVERED ,理想情况下所有 3 个订单的状态都应更改为 DELIVERED ,但与订单关联的行中只有一两行正在更新,但如果我执行相同的 .sql 通过 MySQLWorkbench 文件内容它工作得很好,我可能听起来很愚蠢,但这就是正在发生的事情,我最近 2 天一直在为这种奇怪的行为而苦苦挣扎

请找到下面的屏幕截图,我在其中捕获了此行为 https://www.youtube.com/watch?v=v2HN-n4V0MI&feature=youtu.be

您的暂存 table 是一个引用 table,对引用 table 的写入将异步复制到集群。这就是为什么您的更新有时会按预期工作而有时却不会。

你可以

  • 写入参考后稍等table
  • 进行分期table非参考